五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網 會員登陸 & 注冊

深度學習多模態(tài)實戰(zhàn)班

2023-03-01 11:03 作者:南蠻果  | 我要投稿
  1. 之眼視覺的提取,大多用的是Faster R-CNN:
    1.1 直接提取視覺向量;
    1.2 進行目標檢測,輸出bounding box和對應位置;
    1.3 進行目標檢測,提取類別特征。
    潛在問題:提取的信息有冗余和噪音,對下游任務有益的視覺信息沒有被有效提取,和對應的文本信息有語義鴻溝,不好做視覺-文本對齊等。

  2. 文本一般會用BERT或者Roberta做初始化,大規(guī)模訓練集會從頭開始訓練。

Early fusion:特征提取后,一般是直接concat,進入transformer;
Late fusion:特征提取后,模態(tài)內部再進行深度學習,再做模態(tài)交互。


深度學習多模態(tài)實戰(zhàn)班的評論 (共 條)

分享到微博請遵守國家法律
宣城市| 合山市| 阿图什市| 洪江市| 南京市| 周口市| 炎陵县| 曲松县| 安平县| 锡林浩特市| 阿瓦提县| 闽清县| 石河子市| 清远市| 镇远县| 云阳县| 莱阳市| 太仆寺旗| 长春市| 鸡泽县| 礼泉县| 寿宁县| 静海县| 马尔康县| 秀山| 鹤峰县| 华阴市| 扬中市| 乌兰县| 封丘县| 沿河| 中方县| 洛川县| 天镇县| 高要市| 汾阳市| 通山县| 轮台县| 宁德市| 望都县| 青冈县|