五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

深度學(xué)習(xí)01 多模態(tài)-baseline

2023-03-01 11:30 作者:勾心斗角167  | 我要投稿

模型概況

ALBEF

  1. 雙流模型;

  2. 在預(yù)訓(xùn)練和下游任務(wù)時(shí),使用momentum distillation,緩解圖文數(shù)據(jù)集中的噪聲問題;

  3. 從Mutual Information的視角看圖文對(duì)信息對(duì)齊。

CLIP

  1. 雙流模型,文本和視覺分別進(jìn)入transformer encoder,經(jīng)過線性投影計(jì)算不同圖文對(duì)的相似度;

  2. 使用對(duì)比學(xué)習(xí),將圖片分類轉(zhuǎn)換成圖文匹配任務(wù)。

UniT:文本和視覺分別encoder,concat之后進(jìn)入transformer decoder,根據(jù)head進(jìn)行不同任務(wù)的訓(xùn)練。

Vx2TEXT

  1. 基于backbone network提取模態(tài)特征,經(jīng)過分類器,使用Gumbel-softmax 采樣得到k個(gè)類別,和文本一樣,映射到統(tǒng)一的語言空間;

  2. 端對(duì)端的文本生成模型。


深度學(xué)習(xí)01 多模態(tài)-baseline的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
绵阳市| 苏尼特右旗| 砀山县| 格尔木市| 信阳市| 海门市| 荥阳市| 东辽县| 岑巩县| 桑植县| 北辰区| 永昌县| 婺源县| 灵寿县| 合阳县| 萝北县| 芦溪县| 东丽区| 阿坝县| 黎城县| 沙湾县| 金湖县| 福清市| 泉州市| 二手房| 中牟县| 黔江区| 恩施市| 洪江市| 清苑县| 白沙| 县级市| 海阳市| 顺昌县| 特克斯县| 岚皋县| 忻城县| 许昌市| 辛集市| 南召县| 临泉县|