2024-01-06发表ai

梯度下降笔记

$$
\omega_{t+1} = \omega_t - \alpha \nabla f(\omega_t)
$$

在此例子中, $f(x) = x^2-2x+3$, 一阶导$f’(x) = 2x -2$, 在x=2的导数为2, 可以通俗的理解为当x增长1则f(x)会增长2,
而我们的任务是找f(x)的极小值, 所以极小值的x坐标必定是跟导数2是反方向;
同理在x=0的导数为-2, 即x增长1则f(x)会增长-2, 极小值的x坐标方向确实和导数-2为反向
在这个例子中我们也可以用斜率的投影方向来理解