12 權(quán)重衰退【動(dòng)手學(xué)深度學(xué)習(xí)v2】

2021-12-07 10:02 作者:如果我是泡橘子 0人讀過 | 我要投稿

權(quán)重衰退

最常見的處理過擬合的方法

如何控制模型的容量

硬性限制

θ用來限制權(quán)重 w 的變化范圍
通常不會(huì)限制偏移 b ,從統(tǒng)計(jì)學(xué)上來講，偏移是整個(gè)數(shù)據(jù)對(duì)于 0 點(diǎn)的偏移，是不應(yīng)該限制的，但是實(shí)際上，限不限制效果相同
θ越小，限制就越強(qiáng)。最強(qiáng)的情況下就是θ等于0，所有的w都等于0，只能選一個(gè)偏移
一般來說θ會(huì)選擇1、0.1、0.01

柔性限制

演示對(duì)最優(yōu)解的影響

綠線代表損失函數(shù)l的等高線
綠點(diǎn)代表損失函數(shù)l的最優(yōu)點(diǎn)（只優(yōu)化損失的情況）
w的2次項(xiàng)可以認(rèn)為是一個(gè)以原點(diǎn)為中心的等高線，如橘黃色圓圈
原始的最優(yōu)解（綠點(diǎn)）就不是最優(yōu)了，因?yàn)樗闹祵?duì)于橘黃色的線來說比較大。這里可以理解為w~*就是橘黃色圓圈和綠色圓圈的等高線的值之和，在橘黃色圓圈中，原點(diǎn)值最小，向外增加；在綠色圓圈中，綠點(diǎn)值最小向外增加
如果w~*從綠點(diǎn)出發(fā)，沿著藍(lán)色箭頭走，l的值會(huì)增大，但是w的二次項(xiàng)（閥的項(xiàng)）的值會(huì)減小，走到w*處達(dá)到平衡點(diǎn)總體上來講，閥的引入，使得最優(yōu)解向原點(diǎn)偏移，對(duì)應(yīng)的最優(yōu)解的值會(huì)變得小一些，絕對(duì)值會(huì)變小，從而模型的復(fù)雜度會(huì)變低

參數(shù)更新法則