본문 바로가기
Music AI/Deep Learning

[Deep Learning] 05 미분 | W2 신경망과 로지스틱 회귀 | C1 신경망과 딥러닝 | Andrew Ng

by 2den 2025. 7. 30.
728x90
반응형

https://youtu.be/GzphoJOVEcE?feature=shared

 

이 동영상에서는 미적분과 도함수에 대한 직관을 얻을 수 있도록 해 보겠습니다. 대학교 때 이후로 미적분을 본 적이 없다면, 언제 졸업했는지에 따라 꽤 오래전이었을 수도 있겠지만 그래도 걱정할 필요는 없습니다. 미적분에 대한 깊은 이해 없이도 딥러닝과 신경망을 효율적으로 만들 수 있습니다.

 

이 동영상이나 이후 동영상에서 나오는 미적분이 복잡해서 이 강좌를 듣는 것이 맞는 것인지 생각이 들 수도 있습니다. 제 생각에는 동영상을 보고 프로그래밍 숙제나 다른 숙제를 잘 완료할 수 있다면 딥러닝도 할 수 있다고 생각합니다.

4주차에서는 몇 가지의 함수를 정의해 볼 텐데, 미적분에 필요한 모든 것을 그 안에 담을 수 있습니다. 이것을 정방향 함수와 역방향 함수라 하는데, 미적분에 관한 것을 모두 이 함수에 담아 미적분에 그 이상으로 신경 쓸 필요가 없어집니다.

 

그래도 딥러닝에 대해 배우고 있으니 이번 주에는 상자를 열고 미적분에 대해서 좀 더 알아보고자 하는데, 알고리즘을 만들 때는 직관적인 이해만 가지고 있어도 됩니다. 그리고 여러분이 미적분에 능숙한 몇 안 되는 사람 중 한 명이라면 이 동영상을 건너 뛰어도 괜찮습니다. 나머지 분들은 이제 도함수에 대해 배워 봅시다.

 


 

(1) f

 

함수 $f(a) = 3a$를 그려놓았습니다. 직선이죠. 도함수에 대한 이해를 돕기 위해 이 함수에 대하여 알아봅시다.

$a$가 2라고 해 봅시다. 그러면 $f(a) = 3a$이니 $f(a)$는 6입니다. $a$의 값을 살짝 밀어서 이제 $a$가 2.001이라고 해 봅시다. 0.001의 차이는 그리기에 너무 작으니 그림의 비율은 신경 쓰지 않겠습니다. $a$를 오른쪽으로 살짝 밀면 이제 $f(a)$는 세 배를 곱한 6.003입니다. 여기에 그려 줍니다. 실제 비율은 생각하지 마세요. 여기가 6.003입니다. 여기 초록색으로 된 부분을 보면 $a$를 오른쪽으로 0.001만큼 밀었을 때 $f(a)$는 0.003 증가합니다. $f$가 올라간 정도는 $a$를 오른쪽으로 민 정도보다 세 배 많습니다. 그러면 $a = 2$에서 함수 $f(a)$의 기울기, 도함수는 3입니다. 도함수는 기울기라고 볼 수 있습니다.

 

도함수라고 하면 어렵게 들리는데, 기울기는 도함수의 개념을 쉽게 말한 것입니다. 도함수라고 하면 함수의 기울기라고 생각하면 됩니다. 기울기를 좀 더 정확히 정의하면, 이 작은 삼각형의 높이를 밑변으로 나눈 값이라고 할 수 있습니다. 0.003 / 0.001이죠. 기울기, 도함수가 3이라는 것은 $a$를 0.001만큼 조금 움직여도 $f(a)$는 $a$를 가로로 민 정도보다 세 배나 커진다는 것을 뜻합니다.

 

이제 선의 기울기를 알아보았으니 이 함수를 다르게 생각해 봅시다. $a$가 5라고 한다면 $f(a) = 3a$이므로 $f(a)$는 15입니다. $a$를 오른쪽으로 살짝 밀어서 5.001이 되게 만들면, $f(a)$는 그 세 배이니까 15.003이 됩니다. 이번에도 $a$를 오른쪽으로 0.001만큼 움직이면 $f(a)$는 그보다 세 배 증가합니다. $f(a)$가 5일 때의 기울기도 3입니다. $f(a)$의 기울기가 3이라는 것은 $\frac{df(a)}{da}$가 변수 $a$를 아주 조금 움직였을 때 함수 $f$의 기울기라는 뜻이고, 이 기울기가 3과 같다고 할 수 있습니다. 이 도함수는 이렇게도 쓸 수 있습니다 : $\frac{d}{da}f(a)$. 그러니까 $f(a)$는 위에 놓든 옆에 놓든 상관없습니다. 어쨌든 이 식이 의미하는 것은 $a$를 오른쪽으로 조금 밀었을 때 $f(a)$는 $a$가 바뀐 양의 세 배 올라간다는 것입니다.

 

이 동영상에서는 도함수를 변수 $a$를 0.001만큼 민 경우로 설명하였는데, 도함수의 정의를 수학적으로 정확히 하려면 $a$를 오른쪽으로 훨씬 작은 값만큼 밀었을 경우로 정의해야 합니다. 0.001도, 0.00000001도, 0.0000000001도 아니고 더 작은 값이어야 합니다.

 

도함수의 정확한 정의는 $a$를 무한소로 밀었을 경우에, 무한대로 작고 작은 양이죠. 그랬을 때 $f(a)$가 그 작고 작은 양의 세 배가 증가된다는 것입니다. 도함수의 정확한 정의는 이러하고, 지금은 직관적인 이해가 필요하니까 $a$를 아주 작은 양 0.001만큼 밀었을 경우로 생각하도록 하겠습니다. 0.001은 작지만 무한소는 아닙니다.

 

이 도함수의 특성 중 하나는 함수의 어느 곳이든 기울기가 3이라는 것입니다. $a$가 2일 때도, 5일 때도 함수의 기울기는 3입니다. $a$의 값이 무엇이든 0.001만큼 증가시키면 $f(a)$의 값은 이것의 세 배 증가한다는 뜻입니다. 따라서 이 함수는 모든 곳의 기울기가 같습니다. 이 직각삼각형을 어디에 그리든지 높이/밑변의 비율은 항상 3:1입니다.

 


 

함수가 직선일 때 기울기, 도함수가 어떤지 이해하셨나요? 방금 본 예제에서는 함수의 기울기가 모든 곳에서 3이었습니다. 다음 동영상에서는 좀 더 복잡한 경우로, 위치가 다를 때 함수의 기울기가 달라지는 경우를 살펴보겠습니다.

728x90
반응형

댓글