施努卡: 3D機器視覺為什么難普及?
著名心理學家赤瑞特拉(Treicher)曾經(jīng)驗證過一組數(shù)據(jù),人類獲取的信息83%來自視覺,11%來自聽覺。顯然,要實現(xiàn)機器智能,邁向智能化時代,視覺信息非常關(guān)鍵,特別是3D視覺。
比如今年最火的元宇宙,要將現(xiàn)實世界在虛擬世界實現(xiàn)映射,需要與3D視覺密切相關(guān)的XR。VR在2015年迎來了投資熱潮,隨后的2016年,被稱為“VR元年”。
當時VR設(shè)備的眩暈感以及內(nèi)容不夠豐富等原因,讓2016年沒能成為“VR元年”。直到2021年,Meta售出了1000萬臺VR頭盔Oculus Quest 2,被業(yè)界認為XR又迎來了新的爆發(fā)期。
自動駕駛汽車和智能機器人也是典型需要3D視覺的領(lǐng)域,但也各自面臨挑戰(zhàn)。自動駕駛汽車領(lǐng)域,采用純2D視覺方案,無論是攝像頭還是激光雷達,需要海量數(shù)據(jù),成本挑戰(zhàn)巨大。機器人中所需的3D視覺技術(shù),也因為技術(shù)和開發(fā)難度限制難以大量應用。
擁有3D視覺領(lǐng)域豐富經(jīng)驗的銀牛微電子聯(lián)合創(chuàng)始人兼副總裁何火高指出,“3D視覺不只是單純和芯片或算法的問題,還涉及到相關(guān)的光學、結(jié)構(gòu)、散熱等問題,加上芯片、算法構(gòu)成的復雜技術(shù)系統(tǒng),使3D視覺的芯片和解決方案有非常高的技術(shù)門檻,需要投入更多時間、技術(shù)、人才?!?/strong>
“一個好的技術(shù)和一個成功的產(chǎn)品最終能否推動整個生態(tài)去發(fā)展,中間有巨大的鴻溝,這個鴻溝可能90%是軟件的工作量?!卑滓葸M一步表示,“只有提供完整的系統(tǒng)級解決方案,才能滿足市場需求。我們也相信雙目3D視覺會把整個人工智能機器視覺的成本降低。”
技術(shù)的高門檻,也讓這一領(lǐng)域只有少數(shù)擁有極強技術(shù)和產(chǎn)品實力的公司,這阻礙了3D視覺技術(shù)的快速普及。一個很好的例子就是蘋果以3.6億美元收購了以色列3D芯片公司PrimeSense,并申請了專利,在iPhone上實現(xiàn)了3D人臉識別Face ID功能,其它廠商由于沒有類似的技術(shù)和產(chǎn)品供應商,很難在手機上實現(xiàn)如同蘋果的3D識別功能。
在XR、自動駕駛汽車和智能機器人領(lǐng)域,市場上迎來了一款融合多種功能的3D視覺感知AI芯片,可能帶動3D視覺在這些領(lǐng)域的爆發(fā)。