五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊

Swin Transformer從零詳細(xì)解讀

2022-10-18 17:40 作者:不敗阿豪  | 我要投稿

?
1.SwinTRM整體架構(gòu)解讀 P1 - 00:49
?

整個(gè)視頻四部分


?
1.SwinTRM整體架構(gòu)解讀 P1 - 01:41
?

回顧TRM模型

TRM的encoder并不改變輸入和輸出的形狀,無論vit還是swin都一樣

?
1.SwinTRM整體架構(gòu)解讀 P1 - 02:56
?

左邊是encoder細(xì)節(jié)結(jié)構(gòu),抽象為右邊灰色的框框


?
1.SwinTRM整體架構(gòu)解讀 P1 - 03:46
?

回顧vit模型


?
1.SwinTRM整體架構(gòu)解讀 P1 - 05:28
?

swin相對(duì)于vit的創(chuàng)新


?
1.SwinTRM整體架構(gòu)解讀 P1 - 06:52
?

如何把圖像變成一個(gè)個(gè)token

問題:復(fù)雜度太大

vit問題


?
1.SwinTRM整體架構(gòu)解讀 P1 - 08:53
?

swin vs vit

vit:把一張圖片分為若干patch(共9個(gè)),每個(gè)patch作為一個(gè)token輸入encoder

swin:把一張大圖片分為一個(gè)個(gè)window(共9個(gè)),window里每一個(gè)像素點(diǎn)作為一個(gè)token輸入encoder


?
1.SwinTRM整體架構(gòu)解讀 P1 - 10:34
?

swintrm整體架構(gòu)圖

看一篇論文最好方法:搞清楚每一個(gè)零部件輸入和輸出的數(shù)據(jù)的形狀和變化

?
1.SwinTRM整體架構(gòu)解讀 P1 - 14:19
?

整體形狀變化


?
1.SwinTRM整體架構(gòu)解讀 P1 - 16:04
?

源代碼實(shí)現(xiàn)的時(shí)候和原架構(gòu)圖不同


?
2.相對(duì)位置編碼解析 P2 - 00:37
?

patch partition



?
2.相對(duì)位置編碼解析 P2 - 02:08
?

第二個(gè)紅色框里的重點(diǎn)內(nèi)容:

1、相對(duì)位置編碼如何實(shí)現(xiàn)?

2、移動(dòng)窗口注意力機(jī)制如何實(shí)現(xiàn)?

3、patch融合如何實(shí)現(xiàn)?

?
2.相對(duì)位置編碼解析 P2 - 02:37
?

相對(duì)位置編碼的實(shí)現(xiàn)

1、TRM中的位置編碼:在輸入部分+位置編碼(正余弦函數(shù),不可以學(xué)習(xí))

2、vit模型中劃分為一個(gè)個(gè)patch后沒有使用正余弦函數(shù),而是初始化一個(gè)個(gè)索引,根據(jù)索引得到參數(shù)

3、swinTRM


?
2.相對(duì)位置編碼解析 P2 - 05:06
?

swinTRM相對(duì)位置信息加在哪里

B的形狀是什么

?
2.相對(duì)位置編碼解析 P2 - 06:43
?

一個(gè)例子




?
2.相對(duì)位置編碼解析 P2 - 10:06
?

什么是絕對(duì)位置信息

什么是相對(duì)位置信息


?
2.相對(duì)位置編碼解析 P2 - 11:40
?

網(wǎng)格的絕對(duì)位置和相對(duì)位置

1種絕對(duì)位置信息

4種相對(duì)位置信息


?
2.相對(duì)位置編碼解析 P2 - 12:53
?

怎么把4種相對(duì)位置信息加入attention矩陣


?
2.相對(duì)位置編碼解析 P2 - 18:04
?



?
2.相對(duì)位置編碼解析 P2 - 19:42
?

position embedding

?
3.窗口移動(dòng)注意力機(jī)制 P3 - 00:14
?

原始的窗口注意力機(jī)制

存在問題

移動(dòng)窗口注意力


?
3.窗口移動(dòng)注意力機(jī)制 P3 - 03:09
?

移動(dòng)前

移動(dòng)后


當(dāng)窗口滑動(dòng)到最右端出現(xiàn)同一窗口不相鄰的情況,右下端出現(xiàn)4、5、7、8不相鄰

?
3.窗口移動(dòng)注意力機(jī)制 P3 - 07:40
?

mask符號(hào)

矩陣的信息:0元素代表同一窗口,非0元素代表本不相鄰被框到一起

把非0元素置位-100或負(fù)無窮,得到mask矩陣


?
4.復(fù)雜度解析 P4 - 00:19
?


?
4.復(fù)雜度解析 P4 - 05:12
?

單頭

多頭


?
4.復(fù)雜度解析 P4 - 06:15
?

窗口注意力機(jī)制



?
4.復(fù)雜度解析 P4 - 06:44
?

patch merging降采樣










Swin Transformer從零詳細(xì)解讀的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
宁河县| 城步| 新竹县| 宝丰县| 连山| 涪陵区| 山东省| 翁源县| 上蔡县| 中阳县| 海安县| 柏乡县| 丁青县| 正阳县| 铜山县| 阜宁县| 奉化市| 永新县| 婺源县| 崇义县| 江都市| 密山市| 神池县| 松潘县| 丹东市| 临颍县| 沧源| 南康市| 海城市| 纳雍县| 抚顺县| 文成县| 福州市| 家居| 横峰县| 浦城县| 河西区| 漳平市| 无锡市| 武强县| 会昌县|