五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

計(jì)算機(jī)視覺(jué)方向的博士,如何做到一直follow新技術(shù)?

2022-07-26 10:52 作者:計(jì)算機(jī)視覺(jué)life  | 我要投稿

原文鏈接:https://mp.weixin.qq.com/s/_ppQ9sYdsJTkFYyR_LEhpQ

大家好,我是小6,計(jì)算機(jī)視覺(jué)領(lǐng)域的新論文、新方法可謂是日新月異,那么作為從業(yè)者,如何能最快獲取最新的技術(shù)資訊?我覺(jué)得有以下幾點(diǎn):

1、訂閱本領(lǐng)域的技術(shù)媒體,尤其是那些能夠發(fā)布最新動(dòng)態(tài)及解讀的機(jī)構(gòu)(比如我們計(jì)算機(jī)視覺(jué)life的公眾號(hào)及視頻平臺(tái)

圖片

2、多和同行交流,溝通(比如參加國(guó)際會(huì)議)。做研究就是在交流中迸發(fā)思路,獲取新知的,不僅僅是最新的資訊,還有思想火花的碰撞,對(duì)于拓展思路,解決難題非常有用。

3、自己查找關(guān)注本領(lǐng)域的論文,比如ArXiv 就是不錯(cuò)的渠道。

不知道你有哪些好的渠道?這里我們選取了知乎上的幾位答主,供大家學(xué)習(xí)交流,歡迎留言區(qū)討論。

謝凌曦

鏈接:

https://www.zhihu.com/question/478158497/answer/2475253379

在閱讀下面的回答之前,先明確一點(diǎn):每個(gè)人學(xué)習(xí)、思考的習(xí)慣不可能完全相同,甚至可能有很大不同。下面,我會(huì)闡述我的方式,但它不一定適合所有人,要辯證、批判地看待。

首先,我認(rèn)為以科研為目標(biāo)的初學(xué)者需要做的事情有如下幾件(從大到?。?,缺一不可:

  1. 領(lǐng)域級(jí)。構(gòu)建所屬領(lǐng)域的世界觀,了解整個(gè)社區(qū)希望解決哪些問(wèn)題,它分為哪些子問(wèn)題,當(dāng)前的推進(jìn)狀態(tài)如何。在此基礎(chǔ)上,要不時(shí)思考:什么問(wèn)題能做,什么問(wèn)題還不能做,做哪些事情就能把不能做的事情變成能做。

  2. 方向級(jí)。對(duì)于自己研究的方向,要了解它的完整發(fā)展脈絡(luò),包括當(dāng)前通用的算法是如何一步步發(fā)展出來(lái)的,歷史上有哪些成功、失敗的嘗試,等等。

  3. 課題級(jí)。找到一個(gè)具體的課題,深深地鉆研下去,嘗試改進(jìn)現(xiàn)有算法的方方面面,并且最終形成一篇論文。即使論文沒(méi)能發(fā)表在很好的會(huì)議或者期刊上,也能夠得到很好的鍛煉。

以我個(gè)人的情況為例,簡(jiǎn)單說(shuō)明:

  1. 我從事計(jì)算機(jī)視覺(jué)領(lǐng)域的研究。它是人工智能的一個(gè)分支,因此我需要去了解人工智能的大致發(fā)展歷史,要清楚:人工智能的根本問(wèn)題是什么;從數(shù)學(xué)上的形式定義是什么(簡(jiǎn)單地說(shuō),就是給定輸入x和輸出y,尋找函數(shù)使得盡量被滿足);為什么統(tǒng)計(jì)學(xué)習(xí)是當(dāng)前解決這類通用問(wèn)題的最佳途徑(因?yàn)閱?wèn)題往往具有復(fù)雜性和不確定性,因此需要概率建模);深度學(xué)習(xí)是如何提升統(tǒng)計(jì)學(xué)習(xí)能力的,它的前提是什么(大算力和大數(shù)據(jù));深度學(xué)習(xí)有哪些缺陷(數(shù)據(jù)驅(qū)動(dòng)、可解釋性差,等等)。有了這些知識(shí),我就不會(huì)完全迷信深度學(xué)習(xí),從而迷失真正重要的事情。

  2. 我當(dāng)前研究方向之一,是大規(guī)模圖像預(yù)訓(xùn)練算法。我需要清楚:為什么預(yù)訓(xùn)練是必不可少的算法(為什么視覺(jué)任務(wù)通常遵循預(yù)訓(xùn)練+微調(diào)的范式);預(yù)訓(xùn)練算法需要做到什么(捕捉無(wú)標(biāo)簽或者混合標(biāo)簽下的數(shù)據(jù)分布);需要如何與其他方法配合(提供基礎(chǔ)backbone以供下游有監(jiān)督算法微調(diào));預(yù)訓(xùn)練算法的發(fā)展史(包括早期基于geometry的算法、后來(lái)基于contrast的算法、再后來(lái)基于prediction或者generation的算法,等等);這些算法的發(fā)展有什么規(guī)律(這是重點(diǎn),預(yù)訓(xùn)練算法的發(fā)展主要體現(xiàn)了人類對(duì)于視覺(jué)特征本質(zhì)的不斷認(rèn)識(shí),特別是哪些情況下視覺(jué)特征應(yīng)該保持不變這個(gè)根本問(wèn)題的回答)。當(dāng)然,當(dāng)前的算法還有很多不完美的地方,這就是我努力的方向。

  3. 根據(jù)上面的認(rèn)識(shí),我就可以找到一些課題,最終完成具體的工作。例如,我認(rèn)為當(dāng)前的預(yù)訓(xùn)練方法大多假設(shè)data augmentation后圖像與原先圖像具有相同的特征,以此來(lái)獲取學(xué)習(xí)的動(dòng)力。這個(gè)假設(shè)有一定的問(wèn)題,也造成了當(dāng)前算法的一些局限性。這樣,我就找到了可做的課題,可以在一段時(shí)間內(nèi)仔細(xì)研究。

也就是說(shuō),初學(xué)者需要構(gòu)建起層次化的知識(shí)體系,為此可能需要數(shù)年的時(shí)間來(lái)不斷學(xué)習(xí)、研究、思考,迭代自己的知識(shí)庫(kù)。我提幾個(gè)具體的建議,以提高follow新技術(shù)的效率。和上面的順序相反,下面的建議是從小到大的。

  • 每天讀論文,比如arXiv推送。初學(xué)者可以每天花2-3小時(shí)讀論文,熟練以后可以逐漸縮短到0.5-1小時(shí)。一開(kāi)始讀得慢不要緊,學(xué)費(fèi)總是要交的。逐漸地,你會(huì)意識(shí)到這樣一件事:論文分為兩類,一類拓展了認(rèn)知邊界,一類在邊界范圍內(nèi)把事情做得更好——大部分論文都屬于第二類,而這類論文往往不需要花費(fèi)太多時(shí)間去讀,除非你特別關(guān)心其中的某些細(xì)節(jié)。每天掃arXiv列表的時(shí)候,完全可以跳過(guò)其中80%以上的論文,只去讀自己感興趣的論文,接受漏掉一些“可能有用”的論文:如果這些論文真的很重要,你遲早會(huì)在其他推送里看到它。說(shuō)到推送,公眾號(hào)們推送的文章并不一定是重要的文章,就像當(dāng)紅明星的演技不一定好一樣。要有自己的判斷力。

  • 維護(hù)一個(gè)研究方向的重要問(wèn)題列表,不時(shí)審視這些問(wèn)題,想想最近有沒(méi)有看到什么能夠推進(jìn)這些問(wèn)題的文章或者想法。注意,這些問(wèn)題不應(yīng)太大(比如深度學(xué)習(xí)的可解釋性)也不應(yīng)太?。ū热缒硞€(gè)參數(shù)怎么調(diào)節(jié)才能提升1%的精度),應(yīng)該是適中的。對(duì)于初學(xué)者而言,大概就是“有進(jìn)展了能發(fā)一篇論文”這種級(jí)別的問(wèn)題。每周至少花上2個(gè)小時(shí),放空自己,就這些問(wèn)題展開(kāi)頭腦風(fēng)暴。但是一旦有想法,要寫(xiě)成文字記錄下來(lái)(如果你想發(fā)表英文論文,最好直接用英文寫(xiě)),記錄的過(guò)程就是不斷挑戰(zhàn)自己、充實(shí)想法的過(guò)程。每隔一段時(shí)間,找?guī)讉€(gè)同學(xué)(或者在組會(huì)上)分享自己的想法,哪怕是非常不成熟的思考。

  • 每1-2個(gè)月,給自己一個(gè)任務(wù),隨機(jī)找一個(gè)感興趣的其他研究方向(大多數(shù)情況下不出領(lǐng)域),調(diào)研它的最新進(jìn)展。比如我的研究方向是視覺(jué)預(yù)訓(xùn)練和視覺(jué)識(shí)別的,可以看看最近圖像生成或者三維重建有什么進(jìn)展,了解下最新發(fā)表的模型。這個(gè)活動(dòng),有助于更新你的科研世界觀,讓你反思自己維護(hù)的那個(gè)“什么能做、什么不能做”的知識(shí)庫(kù)是否發(fā)生了變化。例如,NeRF這篇文章就讓我的知識(shí)庫(kù)發(fā)生了快速、中等程度的變化,讓我了解到“三維表示原來(lái)還可以這樣做”;反之鋪天蓋地的Transformer系列文章倒沒(méi)有給我太大沖擊,只是讓我知道這種模塊(數(shù)學(xué)函數(shù))可以更好地?cái)M合數(shù)據(jù)罷了。順便說(shuō)一句,我們要正視Transformer模型在統(tǒng)一圖像和文本方面的潛力,所以CLIP這篇文章,雖然方法非常簡(jiǎn)單,還是開(kāi)創(chuàng)了一個(gè)新的方向,緩慢、中等程度地,更新了我的知識(shí)庫(kù)。要說(shuō)什么文章能夠快速而大幅度地更新知識(shí)庫(kù),怕是要追溯到AlexNet這種具有劃時(shí)代意義的論文了。

此外還有一個(gè)獨(dú)立的:要多跟不同層次的學(xué)者討論,他們會(huì)刷新你不同方面的認(rèn)知。比較senior的學(xué)者可能會(huì)讓你思考一些從未想過(guò)的問(wèn)題,比較junior的學(xué)生可能會(huì)跟你討論很多細(xì)節(jié)問(wèn)題,這些都是有益的。如果你口才好,還可以嘗試給初學(xué)者講課,接受小白的各種問(wèn)題的挑戰(zhàn),這樣也能提高自己。

寫(xiě)得比較亂,希望有所幫助??偨Y(jié)下來(lái),科研最重要的事情,是構(gòu)建并維護(hù)自己的層次化的知識(shí)庫(kù)。這件事急不得,只能通過(guò)點(diǎn)滴積累來(lái)完成。加油!

Huang

鏈接:

https://www.zhihu.com/question/478158497/answer/2205893690

非常能理解這種感受。每次做完一篇工作,我也會(huì)有相似的感受。畢竟我們的精力是有限的,當(dāng)你全身心投入在一篇工作中的時(shí)候,的確很容易忽略和這篇工作沒(méi)有直接聯(lián)系的其他領(lǐng)域的工作。這也是為什么跨領(lǐng)域甚至跨學(xué)科的工作通常都會(huì)是非常有影響力的工作,大到AlphaFold用基因序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),小到ViT用transformer做visual recognition。

我個(gè)人的解決方案通常是這樣的。第一個(gè)是積極地和同行交流,不僅僅是同一個(gè)實(shí)驗(yàn)室的,還可以是不同實(shí)驗(yàn)室的connection。一方面是能和不同領(lǐng)域的同學(xué)交流,另一方面,即使研究領(lǐng)域相同,在不同實(shí)驗(yàn)室的對(duì)于相同問(wèn)題的viewpoint可能也會(huì)或多或少的有些不同的地方。像我現(xiàn)在實(shí)習(xí)的地方,大家都有不同的研究方向,有做self-supervised learning的,有做few-shot classification的,我們有固定的paper reading section,每周會(huì)坐在一起由某個(gè)領(lǐng)域的同學(xué)講幾篇最近自己領(lǐng)域里的發(fā)展,不得不說(shuō)聽(tīng)領(lǐng)域大佬們講自己領(lǐng)域的文章,還是比自己硬啃會(huì)容易follow得多。可能這也是像workshop這類活動(dòng)舉辦的重要意義之一吧~

這也讓我想到自己大三幫本科的班主任做一個(gè)無(wú)人機(jī)跟蹤的項(xiàng)目的時(shí)候,已經(jīng)有很多基于相關(guān)濾波甚至有一些基于deep learning的tracking方法了。無(wú)奈當(dāng)時(shí)雖然關(guān)注到了,但是身邊的同學(xué)包括老師也都不懂這些技術(shù),沒(méi)人交流,自己去硬啃又沒(méi)法meet project deadline,最后無(wú)奈只能用orb特征來(lái)做前后的一個(gè)匹配,幸運(yùn)的是最終也是達(dá)到了性能的要求,成功交差了。但如果當(dāng)時(shí)能夠有幸遇到我兩年后的另一位做tracking導(dǎo)師的話,或者他手底下的學(xué)生的話,很可能在交流之后我能更早更容易地去follow當(dāng)時(shí)的一些熱點(diǎn),做出更加solid的成果。

我的第二個(gè)方法是關(guān)注一些自己可能沒(méi)有什么connection,但是產(chǎn)出質(zhì)量始終很高的大組。比如像基于video的多模態(tài)方向,我最近的一個(gè)回答也總結(jié)了一些我個(gè)人常關(guān)注的list,我一般沒(méi)什么事的時(shí)候就去刷刷這些組里的大老板的google scholar,一方面可以觀察到大佬的引用隔一天都是幾十幾十的漲,另一方面也是可以最快得關(guān)注到和自己領(lǐng)域有一定overlap的組,最近有沒(méi)有追隨什么熱點(diǎn)。

兩種方法對(duì)比,我更喜歡第一種。畢竟第一種方法在很多時(shí)候,可以了解到一些別人正在追隨而還沒(méi)有發(fā)表出文章的熱點(diǎn),比如最近有一個(gè)學(xué)弟在我open source我最新的code之前,就通過(guò)和我交流,自己reimplement了我的方法,做了修改之后性能很好,準(zhǔn)備投cvpr了,而我的文章還在under review...如果是等我的paper和code release之后才去follow的,很可能已經(jīng)慢了一步了。

其實(shí)總結(jié)來(lái)說(shuō),無(wú)非就是多和其他人交流,無(wú)論是通過(guò)面對(duì)面的形式,還是看author親自解讀的方式,亦或是直接讀對(duì)方paper的方式。即使是一個(gè)對(duì)于所有researcher的biased sampling,始終還是相對(duì)自己埋頭苦干有那么一些優(yōu)勢(shì)吧。

最后祝大家的biased sampling都可以sample到最值得follow的熱點(diǎn),做人不缺paper,做paper不缺人~

電光幻影煉金術(shù)

鏈接:

https://www.zhihu.com/question/478158497/answer/2476320815

搞個(gè)思維導(dǎo)圖吧兄弟。下面借鑒和擴(kuò)充了 @謝凌曦 的基本思想。

領(lǐng)域級(jí)思維導(dǎo)圖

我這里憑理解幫你畫(huà)一下氣泡型思維導(dǎo)圖。

圖片
領(lǐng)域級(jí)思維導(dǎo)圖

從上圖可以看出,計(jì)算機(jī)視覺(jué)主要與很多學(xué)科相關(guān),比如人工智能、機(jī)器學(xué)習(xí)、計(jì)算機(jī)圖形學(xué)和機(jī)器人等。了解與不同學(xué)科之間的關(guān)系,可以更好地幫你把握計(jì)算機(jī)視覺(jué)的位置。我這里簡(jiǎn)要概括一下:

  1. 與人工智能的關(guān)系:人工智能是計(jì)算機(jī)視覺(jué)的一大起源,也是重要目的。

  2. 與機(jī)器學(xué)習(xí)的關(guān)系:機(jī)器學(xué)習(xí)是重要的計(jì)算機(jī)視覺(jué)的方法,也是一大思想來(lái)源。

  3. 與計(jì)算機(jī)圖形學(xué)的關(guān)系:圖形學(xué)與視覺(jué)的多個(gè)層面有交叉,技術(shù)互補(bǔ),應(yīng)用有交叉。

  4. 與機(jī)器人的關(guān)系:機(jī)器人是計(jì)算機(jī)視覺(jué)的一個(gè)主要應(yīng)用平臺(tái)。上面這個(gè)圖還可以細(xì)化,幫你了解一些不同領(lǐng)域的細(xì)分課題。

上面這個(gè)圖還可以細(xì)化,幫你了解一些不同領(lǐng)域的細(xì)分課題。

圖片
細(xì)化的領(lǐng)域級(jí)思維導(dǎo)圖

有一個(gè)好的領(lǐng)域級(jí)picture,能夠幫你快速判斷課題的意義大小,在整個(gè)科研世界的位置,以及未來(lái)產(chǎn)業(yè)鏈中的地位??蒲斜仨毩⒆汩L(zhǎng)遠(yuǎn),領(lǐng)域級(jí)的把握是非常重要的。

方向級(jí)思維導(dǎo)圖

這里主要講一下計(jì)算機(jī)視覺(jué)的發(fā)展邏輯,主要解釋一個(gè)根本問(wèn)題:為什么計(jì)算機(jī)視覺(jué)會(huì)有這么多論文冒出來(lái)?解決了這個(gè)根本問(wèn)題,你就不難在計(jì)算機(jī)視覺(jué)這個(gè)大領(lǐng)域有立足之地,同時(shí)順藤摸瓜,逐漸把自己的地盤(pán)做大。這里使用流程型思維導(dǎo)圖:

圖片
計(jì)算機(jī)視覺(jué)的發(fā)展邏輯

任何一個(gè)計(jì)算機(jī)視覺(jué)的子領(lǐng)域,都滿足上述的一個(gè)發(fā)展邏輯:先有傳統(tǒng)任務(wù)(就是經(jīng)典的不能再經(jīng)典的,圖像分類之類的),然后有一些初始的模型。之后隨著新概念、新模型的興起(比如transformer),提出了很多很新的fancy的模型。之后經(jīng)過(guò)大量的實(shí)驗(yàn)沉淀,淘汰掉不好用的fancy模型,最后留下來(lái)扎實(shí)的模型(solid model),最后再產(chǎn)生新的任務(wù)(比如跨越領(lǐng)域的、更大規(guī)模的等等)。

了解自己領(lǐng)域的發(fā)展階段,能比別人看的更遠(yuǎn),是做出跨時(shí)代研究的基礎(chǔ)。

課題級(jí)思維導(dǎo)圖

具體要選課題的話,需要了解一下計(jì)算機(jī)視覺(jué)的一些基本任務(wù)/熱門(mén)任務(wù),以及每個(gè)任務(wù)的前途、SOTA方法、研究多深。新手的話一定要分清什么是課題/任務(wù)、什么是模型:課題是一個(gè)與模型無(wú)關(guān)的問(wèn)題,模型是一種解決問(wèn)題的手段。我這里主要對(duì)任務(wù)進(jìn)行梳理,不涉及模型。

注意現(xiàn)在每個(gè)分課題幾乎都有群聊,新手可以加入群聊看看大家在聊什么,融入一個(gè)好的科研氛圍。

這里使用最基本的樹(shù)狀圖:

圖片

掌握科研與工程的明暗線

計(jì)算機(jī)視覺(jué)是一個(gè)典型的工程向領(lǐng)域,提供好的工程進(jìn)展(包括工具庫(kù)、工程經(jīng)驗(yàn)、工程參數(shù))對(duì)科研的貢獻(xiàn),遠(yuǎn)大于幾篇灌水的論文!

從科研工作者的角度,把握科研與工程的雙線進(jìn)步,是保持科研進(jìn)展,發(fā)solid論文的不二法門(mén)。

這里用魚(yú)骨思維導(dǎo)圖來(lái)展示:

圖片
科研工程雙線魚(yú)骨圖

魚(yú)骨上方展現(xiàn)的是科研的幾個(gè)比較重要的特質(zhì),比如要有新的概念、發(fā)掘新的問(wèn)題、實(shí)現(xiàn)新的框架、或者要有新的應(yīng)用。

魚(yú)骨下方展示的是工程上比較重要的技術(shù),要有更公平的比較,更好用的開(kāi)源庫(kù),更高效的實(shí)現(xiàn)等等。

既要仰望星空,也要腳踏實(shí)地。既要大膽猜想,也要小心嘗試。把握好科研與工程的平衡發(fā)展,也是必要的技巧。

劉斯坦

鏈接:

https://www.zhihu.com/question/478158497/answer/2047856357

lstm、rnn、transformer這些,是任何一本深度學(xué)習(xí)教材上都會(huì)講的,屬于基礎(chǔ)知識(shí)哈,不到“新技術(shù)”的地步,所以可能還是得先補(bǔ)充基礎(chǔ)知識(shí)。。。

我一個(gè)工程師,都得時(shí)不時(shí)看有沒(méi)有新的成果出來(lái),和自己做的方向相關(guān)的,更是要緊盯。博士,每天刷新的論文應(yīng)該算是日常操作吧?

最后要做到自己熟悉的領(lǐng)域掃一眼論文里的圖片就大概知道重點(diǎn)在哪里,值不值得看。各種量級(jí)的模型在各個(gè)數(shù)據(jù)集上的精確度和推斷速度要心里有底。有很多文章,他只和表現(xiàn)比他差的模型去比較,很多模型都是上古模型;瘋狂overfit某個(gè)數(shù)據(jù)集,不覆蓋大部分?jǐn)?shù)據(jù)集,這些一看就知道沒(méi)什么價(jià)值。

告訴你一個(gè)辦法,如果你覺(jué)得一篇文章很不錯(cuò),那就上知乎搜一下看有沒(méi)有人提到,有人提,熱度不低,基本就算值得一看了。熱度高的文章,把各路知友的文章看一遍基本也就差不多了。

樓上有知友提到直接看頂會(huì),頂會(huì)當(dāng)然要看,但絕對(duì)是不夠的,很多成果等到頂會(huì)發(fā)表,已經(jīng)滯后半年了,還是要密切關(guān)注arxiv。

以上轉(zhuǎn)自知乎原作者,僅作為學(xué)習(xí)交流使用,如有侵權(quán),聯(lián)系刪除不知道你有哪些好的渠道?歡迎留言區(qū)討論。

? ? ? ? ? ? ? ?

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?計(jì)算機(jī)視覺(jué)life ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?

聚焦計(jì)算機(jī)視覺(jué)、機(jī)器人SLAM、自動(dòng)駕駛、AR領(lǐng)域核心技術(shù)。系統(tǒng)學(xué)習(xí)教程官網(wǎng)cvlife.net

352篇原創(chuàng)內(nèi)容 ? ? ? ? ? ? ? ? ? ? ? ?

公眾號(hào)

獨(dú)家重磅課程官網(wǎng):cvlife.net

圖片

全國(guó)最大的機(jī)器人SLAM開(kāi)發(fā)者社區(qū)

圖片


技術(shù)交流群


圖片


—? ?版權(quán)聲明? —

本公眾號(hào)原創(chuàng)內(nèi)容版權(quán)屬計(jì)算機(jī)視覺(jué)life所有;從公開(kāi)渠道收集、整理及授權(quán)轉(zhuǎn)載的非原創(chuàng)文字、圖片和音視頻資料,版權(quán)屬原作者。如果侵權(quán),請(qǐng)聯(lián)系我們,會(huì)及時(shí)刪除。

計(jì)算機(jī)視覺(jué)方向的博士,如何做到一直follow新技術(shù)?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
临沭县| 夹江县| 凌源市| 富宁县| 略阳县| 汉阴县| 磐石市| 娄底市| 凤庆县| 东乌| 萝北县| 罗山县| 连州市| 临泽县| 策勒县| 磐石市| 昭平县| 鹤山市| 正阳县| 方城县| 靖西县| 华坪县| 兴文县| 罗定市| 安仁县| 青岛市| 卓资县| 吉木萨尔县| 奎屯市| 克拉玛依市| 凤庆县| 遵义县| 黔江区| 兴山县| 新乡市| 邳州市| 临夏市| 仁化县| 青神县| 铜陵市| 革吉县|