【沈向洋帶你讀論文】Oscar 視覺(jué)語(yǔ)言跨模態(tài)表示學(xué)習(xí)


解決視覺(jué)語(yǔ)言的聯(lián)合訓(xùn)練問(wèn)題

把Bert預(yù)訓(xùn)練方法用到視覺(jué)語(yǔ)言表征學(xué)習(xí)里面
可放到下游任務(wù)里面,看到一系列的改進(jìn)

多模態(tài)表征,關(guān)心把多模態(tài)的數(shù)據(jù),多模態(tài)的一些單詞也好,圖像里面的一個(gè)物體的一個(gè)區(qū)域也好,投影到公共空間

核心是如何學(xué)習(xí)視覺(jué)和語(yǔ)言對(duì)齊表示

三元組表示

實(shí)驗(yàn)結(jié)果

單詞區(qū)域?qū)R重點(diǎn)
重點(diǎn)參考文獻(xiàn)

大力出奇跡,更好表示
增加數(shù)據(jù)量增加算力
找數(shù)據(jù)聯(lián)系
標(biāo)簽: