Talk預(yù)告 | 中科院自動化研究所尼博琳:拓展語言-圖像模型用于視頻識別

本期為TechBeat人工智能社區(qū)第437期線上Talk。
北京時(shí)間9月7日(周三)20:00,中科院自動化研究所在讀博士生——尼博琳的Talk將準(zhǔn)時(shí)在TechBeat人工智能社區(qū)開播!他與大家分享的主題是: “拓展語言-圖像模型用于視頻識別”,屆時(shí)將介紹如何將語言-圖像模型拓展到視頻識別領(lǐng)域,打造一個更加通用的視頻識別框架。
Talk·信息
主題:拓展語言-圖像模型用于視頻識別
嘉賓:中科院自動化研究所在讀博士生?尼博琳
時(shí)間:北京時(shí)間?9月7日?(周三) 20:00
地點(diǎn):TechBeat人工智能社區(qū)
http://www.techbeat.net/

完整版怎么看?
掃描下方二維碼,或復(fù)制鏈接https://datayi.cn/w/korVX86o瀏覽器,一鍵完成預(yù)約!上線后會在第一時(shí)間收到通知哦?
Talk·介紹
近年來,語言-圖像預(yù)訓(xùn)練模型表現(xiàn)出強(qiáng)大泛化和遷移能力。在本工作中,我們探索如何將語言-圖像模型拓展到視頻識別領(lǐng)域,打造一個更加通用的視頻識別框架。我們提出的方法在不同的數(shù)據(jù)條件下均取得了優(yōu)異的性能。
具體分享提綱如下:
1. 背景和動機(jī)
視頻識別
語言-圖像預(yù)訓(xùn)練
2. 方法
拓展語言-圖像模型用于視頻識別的框架
跨幀交流編碼器
視頻內(nèi)容自適應(yīng)的文本提示學(xué)習(xí)
3. 實(shí)驗(yàn)結(jié)果
Talk·預(yù)習(xí)資料
CIP:https://arxiv.org/abs/2103.00020
Florence:https://arxiv.org/abs/2111.11432
ALIGN:https://arxiv.org/abs/2102.05918
Talk·提問交流
通過以下兩種方式提問都將獲得微信現(xiàn)金紅包獎勵哦!
方式 ①
在Talk界面下的【交流區(qū)】參與互動!留下你的打call??和問題??,和更多小伙伴們共同討論,被講者直接翻牌解答!

你的每一次貢獻(xiàn),我們都會給予你相應(yīng)的i豆積分,還會有驚喜獎勵哦!
方式 ②
在本文留言區(qū)直接提出你的問題,或掃描下方二維碼提問!

Talk·嘉賓介紹

中科院自動化研究所在讀博士生
目前就讀于中科院自動化研究所,現(xiàn)在是一年級博士生。主要研究領(lǐng)域?yàn)橐曨l內(nèi)容理解,網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)和搜索,多模態(tài)模型等,研究成果在ECCV等會議發(fā)表。
個人主頁:
https://github.com/nbl97


關(guān)于TechBeat人工智能社區(qū)
TechBeat (www.techbeat.net) 是一個薈聚全球華人AI精英的成長社區(qū)。 我們希望為AI人才打造更專業(yè)的服務(wù)和體驗(yàn),加速并陪伴其學(xué)習(xí)成長。 期待這里可以成為你學(xué)習(xí)AI前沿知識的高地,分享自己最新工作的沃土,在AI進(jìn)階之路上的升級打怪的根據(jù)地!
更多詳細(xì)介紹>>https://mp.weixin.qq.com/s/pTbCK_MeTk05jK2yx1RTrQ