五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深度之眼多模態(tài)實戰(zhàn)班

2023-03-14 11:11 作者:清衛(wèi)怡  | 我要投稿

特征提取

  1. 視覺的提取,大多用的是Faster R-CNN:
    1.1 直接提取視覺向量;
    1.2 進行目標(biāo)檢測,輸出bounding box和對應(yīng)位置;
    1.3 進行目標(biāo)檢測,提取類別特征。
    潛在問題:提取的信息有冗余和噪音,對下游任務(wù)有益的視覺信息沒有被有效提取,和對應(yīng)的文本信息有語義鴻溝,不好做視覺-文本對齊等。

  2. 文本一般會用BERT或者Roberta做初始化,大規(guī)模訓(xùn)練集會從頭開始訓(xùn)練。

Early fusion:特征提取后,一般是直接concat,進入transformer;
Late fusion:特征提取后,模態(tài)內(nèi)部再進行深度學(xué)習(xí),再做模態(tài)交互。


深度之眼多模態(tài)實戰(zhàn)班的評論 (共 條)

分享到微博請遵守國家法律
荔波县| 游戏| 仁寿县| 北碚区| 旅游| 监利县| 镇宁| 公主岭市| 南漳县| 平南县| 那曲县| 宁陵县| 奉节县| 华坪县| 临洮县| 尖扎县| 屏东县| 绥中县| 新泰市| 平度市| 长汀县| 莆田市| 武穴市| 花垣县| 通许县| 梅河口市| 年辖:市辖区| 郸城县| 阳谷县| 长汀县| 泉州市| 荣成市| 巩义市| 扬中市| 栾城县| 湾仔区| 威远县| 韶山市| 沈阳市| 台中市| 邻水|