[Deep Learning] 역전파(Backpropagation)

March 17, 2021 1 minute read

역전파(Backpropagation)

미분의 연쇄법칙 + 오차 역전파 알고리즘

함수형 Model의 학습 원리인 ‘경사하강법’은 학습 단계의 파라미터 업데이트를 위해 파라미터별 편미분 값을 계산한다.

Hidden Layer와 Node 개수가 증가하여 파라미터 개수가 많아진다면, 수치 미분으로 계산하는데 많은 컴퓨팅 자원과 시간이 소요된다.

역전파는 수치미분 과정없이 연쇄법칙을 통해 미분값을 획득하는 알고리즘으로서 경사값을 계산하는데 걸리는 시간을 줄여준다.

합성 함수의 미분은 합성 함수를 구성하는 개별 함수 미분의 곱

신경망은 간단한 함수들의 중첩(합성함수)로 구성되어 있다고 할 수 있다.

input(X) -> Node 1 -> Node 2 -> Node 3-> Output($\hat{y}$) 이라면,

$\hat{y} = sigmoid(W_3 \ast sigmoid(W_2 \ast sigmoid(W_1 X + b_1) + b_2) + b_3)$

합성함수의 미분은 구성된 개별 함수 미분의 곱이다(연쇄 법칙).

합성 함수의 미분은 $ {f(g(x))}^\prime \ = \ f^\prime (g(x)) \times g^\prime (x)$ 로 개별 함수 미분의 곱이다.

1) 순전파(Forward propagation)를 수행하여 $\hat{y}$를 계산하고, 오차값(MSE or CEE)을 계산한다.

2) 오차값이 감소하는 방향으로 가중치(weight) 수정한다.

파라미터 학습을 위한 미분 값이 0에 가까워지는 것

https://ayyucekizrak.medium.com/derin-öğrenme-için-aktivasyon-fonksiyonlarının-karşılaştırılması-cee17fd1d9cd