freeCodeCamp

4.2 KiB

Raw Blame History

title	localeTitle
Backpropagation	обратное распространение

обратное распространение

Backprogapation - это подтема нейронных сетей , и это процесс, посредством которого вы вычисляете градиенты каждого узла в сети. Эти градиенты измеряют «ошибку», каждый из которых вносит вклад в выходной уровень, поэтому при обучении нейронной сети эти градиенты минимизируются.

Примечание. Просвещение назад и машинное обучение в целом требовали значительного знакомства с линейной алгеброй и матричной манипуляцией. Курсовая работа или чтение по этой теме настоятельно рекомендуется, прежде чем пытаться понять содержание этой статьи.

вычисление

Процесс обратного распространения можно объяснить тремя шагами.

Учитывая следующее

m учебных примеров (x, y) на нейронной сети из L-слоев
g = сигмоидальная функция
Theta (i) = матрица перехода от i-го до i + 1-го слоя
a (l) = g (z (l)); массив значений узлов в слое l на основе одного примера обучения
z (l) = Theta (l-1) a (l-1)
Delta - набор L-матриц, представляющих переходы между i-м и i + 1-м слоем
d (l) = массив градиентов для слоя l для одного примера обучения
D набор L-матриц с окончательными градиентами для каждого узла
лямбда - термин регуляризации для сети

В этом случае для матрицы M M будет обозначать транспонирование матрицы M

Назначьте все записи Delta (i), для i от 1 до L, ноль.
Для каждого примера обучения t от 1 до m выполните следующие действия:

выполнить прямое распространение на каждом примере для вычисления a (l) и z (l) для каждого слоя
вычисление d (L) = a (L) - y (t)
вычисление d (l) = (Theta (l) '• d (l + 1)) • g (z (l)) для l из L-1 в 1
приращение Delta (l) на delta (l + 1) • a (l) '

Подключите матрицу Delta к нашим частным производным матрицам D (l) = 1 \ m (Delta (l) + lambda • Theta (l)); если l ≠ 0 D (l) = 1 \ m • Delta (l); если l = 0

Конечно, просто просмотр этой статьи выглядит чрезвычайно сложным и должен действительно пониматься только в более широких контекстах нейронных сетей и машинного обучения. Посмотрите на переписанные ссылки для лучшего понимания темы в целом.

4.2 KiB Raw Blame History Unescape Escape

обратное распространение

вычисление

Дополнительная информация:

4.2 KiB

Raw Blame History