散文網(wǎng) » 科技 »學(xué)習(xí) » Talk預(yù)告 | 中科院自動化研究所尼博琳：拓展語言-圖像模型用于視頻識別

Talk預(yù)告 | 中科院自動化研究所尼博琳：拓展語言-圖像模型用于視頻識別

2022-09-07 11:59 作者:TechBeat人工智能社區(qū) 0人讀過 | 我要投稿

本期為TechBeat人工智能社區(qū)第437期線上Talk。

北京時(shí)間9月7日(周三)20:00，中科院自動化研究所在讀博士生——尼博琳的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開播！他與大家分享的主題是: “拓展語言-圖像模型用于視頻識別”，屆時(shí)將介紹如何將語言-圖像模型拓展到視頻識別領(lǐng)域，打造一個更加通用的視頻識別框架。

Talk·信息

主題：拓展語言-圖像模型用于視頻識別

嘉賓：中科院自動化研究所在讀博士生?尼博琳

時(shí)間：北京時(shí)間?9月7日?(周三) 20:00

地點(diǎn)：TechBeat人工智能社區(qū)

http://www.techbeat.net/

完整版怎么看？

掃描下方二維碼，或復(fù)制鏈接https://datayi.cn/w/korVX86o瀏覽器，一鍵完成預(yù)約！上線后會在第一時(shí)間收到通知哦?

Talk·介紹

近年來，語言-圖像預(yù)訓(xùn)練模型表現(xiàn)出強(qiáng)大泛化和遷移能力。在本工作中，我們探索如何將語言-圖像模型拓展到視頻識別領(lǐng)域，打造一個更加通用的視頻識別框架。我們提出的方法在不同的數(shù)據(jù)條件下均取得了優(yōu)異的性能。

具體分享提綱如下：

1. 背景和動機(jī)

視頻識別
語言-圖像預(yù)訓(xùn)練

2. 方法

拓展語言-圖像模型用于視頻識別的框架
跨幀交流編碼器
視頻內(nèi)容自適應(yīng)的文本提示學(xué)習(xí)

3. 實(shí)驗(yàn)結(jié)果

Talk·預(yù)習(xí)資料

CIP：https://arxiv.org/abs/2103.00020
Florence：https://arxiv.org/abs/2111.11432
ALIGN：https://arxiv.org/abs/2102.05918

Talk·提問交流

通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦！

方式 ①

在Talk界面下的【交流區(qū)】參與互動！留下你的打call??和問題??，和更多小伙伴們共同討論，被講者直接翻牌解答！

你的每一次貢獻(xiàn)，我們都會給予你相應(yīng)的i豆積分，還會有驚喜獎勵哦！

方式 ②

在本文留言區(qū)直接提出你的問題，或掃描下方二維碼提問！

Talk·嘉賓介紹

目前就讀于中科院自動化研究所，現(xiàn)在是一年級博士生。主要研究領(lǐng)域?yàn)橐曨l內(nèi)容理解，網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)和搜索，多模態(tài)模型等，研究成果在ECCV等會議發(fā)表。

個人主頁：

https://github.com/nbl97

關(guān)于TechBeat人工智能社區(qū)

TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn)，加速并陪伴其學(xué)習(xí)成長。期待這里可以成為你學(xué)習(xí)AI前沿知識的高地，分享自己最新工作的沃土，在AI進(jìn)階之路上的升級打怪的根據(jù)地！

更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ

標(biāo)簽：