SFFAI 104 目標(biāo)檢測(cè)專題(本周日直播)
特征金字塔(Feature Pyramid Networks, FPN)是一種利用常規(guī)CNN模型來高效提取圖片中各維度特征的方法,可以用于解決識(shí)別尺寸差異很大的物體的問題。它對(duì)每一種尺度的圖像進(jìn)行特征提取,能夠產(chǎn)生多尺度的特征表示,并且所有等級(jí)的特征圖都具有較強(qiáng)的語義信息,甚至包括一些高分辨率的特征圖。本期我們邀請(qǐng)到了來自曠視的楊同,詳細(xì)闡釋為何FPN能夠成功。

講者介紹
楊同,北京曠視科技有限公司basemodel組研究員,主要研究方向?yàn)橥ㄓ梦矬w檢測(cè),目前在 NeurIPS、CVPR、AAAI等會(huì)議上發(fā)表論文6篇。
報(bào)告題目
You Only Look One-level Feature
會(huì)議摘要
目前,F(xiàn)PN是通用物體檢測(cè)的一個(gè)重要組件,有效提升了物體檢測(cè)的性能。但是,現(xiàn)有工作都是基于兩階段方法中對(duì)FPN的理解,認(rèn)為FPN的主要作用是不同層級(jí)的特征融合。而對(duì)于單階段檢測(cè)方法中,卻很少有工作深入分析FPN成功的原因。本文從優(yōu)化角度對(duì)FPN進(jìn)行了分解,指出分治思想是FPN在單階段檢測(cè)中成功的至關(guān)重要的因素。然而,在單階段檢測(cè)中,F(xiàn)PN帶來的在多層級(jí)特征上檢測(cè)的范式,大大增大了模型的計(jì)算量與減慢了模型推理速度??紤]到FPN帶來的副作用,我們提出一種不同于原先多層級(jí)特征檢測(cè)的方法: YOLOF,該方法采用基于單個(gè)層級(jí)特征(C5)的檢測(cè)模式。它包括兩個(gè)模塊: 多尺度編碼器(Dilated Encoder)和一致性匹配策略(Uniform Matching)。該模型在COCO數(shù)據(jù)集上的性能可以達(dá)到基于FPN的檢測(cè)模型并且推理速度更快。與DETR相比,YOLOF可以在1/7的訓(xùn)練輪數(shù)下達(dá)到差不多一致的性能。除此之外,相對(duì)YOLOv4,YOLOF(60FPS)可以達(dá)到44.3 mAP,在精度和速度上超過YOLOv4。
會(huì)議亮點(diǎn)
1、不同于FPN現(xiàn)有認(rèn)知: 多層級(jí)特征融合是FPN的關(guān)鍵,本文指出FPN中的分治思想是單階段檢測(cè)模型成功的因素;
2、本文提出了一種基于單個(gè)層級(jí)特征(C5) 的單階段檢測(cè)模型。該模型可以達(dá)到基于FPN的檢測(cè)模型的性能但是推理速度更快;
3、本文為通用物體檢測(cè)提供了一個(gè)新方向: 如何充分挖掘單個(gè)層級(jí)特征的表示能力。
直播時(shí)間
2021年4月25日(周日)20:00—21:00 線上直播
關(guān)注微信公眾號(hào):人工智能前沿講習(xí),對(duì)話框回復(fù)“SFFAI104”,獲取入群二維碼
注:直播地址會(huì)分享在交流群內(nèi)

現(xiàn)代科學(xué)技術(shù)高度社會(huì)化,在科學(xué)理論與技術(shù)方法上更加趨向綜合與統(tǒng)一,為了滿足人工智能不同領(lǐng)域研究者相互交流、彼此啟發(fā)的需求,我們發(fā)起了SFFAI這個(gè)公益活動(dòng)。SFFAI每周舉行一期線下活動(dòng),邀請(qǐng)一線科研人員分享、討論人工智能各個(gè)領(lǐng)域的前沿思想和最新成果,使專注于各個(gè)細(xì)分領(lǐng)域的研究者開拓視野、觸類旁通。
SFFAI目前主要關(guān)注機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、自然語言處理等各個(gè)人工智能垂直領(lǐng)域及交叉領(lǐng)域的前沿進(jìn)展,將對(duì)線下討論的內(nèi)容進(jìn)行線上傳播,使后來者少踩坑,也為講者塑造個(gè)人影響力。SFFAI還在構(gòu)建人工智能領(lǐng)域的知識(shí)森林—AI Knowledge Forest,通過匯總各位參與者貢獻(xiàn)的領(lǐng)域知識(shí),沉淀線下分享的前沿精華,使AI Knowledge Tree枝繁葉茂,為人工智能社區(qū)做出貢獻(xiàn),歡迎大家關(guān)注SFFAI論壇:https://bbs.sffai.com。
