有獎調查 | 召喚KWS/ASR愛好者

參與KWS\ASR (關鍵詞喚醒\語音識別)調研贏獎品
今天,你有沒有跟手機上的Siri玩成語接龍?下班回家后,你家的Echo有沒有熱情地歡迎你回來?
不知不覺中,AI已經(jīng)深入到我們生活的方方面面,而語音交互成為最基本最直接的AI控制方式。語音交互生態(tài)的成熟,將會帶動越來越多的設備語音化、智能化,使語音真正成為人機交互的界面。
語音識別,云端還是終端
語音識別技術是指機器自動將人的語音的內容轉成文字,又稱?Automatic Speech Recognition,即ASR技術。
語音識別方案主要有三大部分組成:語義識別平臺,CPU主控,以及MIC(麥克風)陣列。
當前主流的語音識別方案是在終端上進行聲音采集和前處理,語音識別算法則放在服務器(即云端)上運行。這是因為作為CPU主控,目前嵌入式終端上的CPU性能還不夠強勁。這種方案有泄漏隱私(把終端上的語音數(shù)據(jù)發(fā)給服務器)和無網(wǎng)狀態(tài)不能使用等缺點。隨著終端CPU性能日益強大,未來的語音識別所有功能都能夠終端上實現(xiàn)。
關鍵詞喚醒,可以在終端
不過,目前我們也不用消極等待。關鍵詞喚醒功能(Key-word-spotting, KWS)是可以在終端上實現(xiàn)的。關鍵詞喚醒是指設定一個喚醒詞,如Siri的“Hi Siri”,只有用戶說了喚醒詞后,終端上的語音識別功能才會處于工作狀態(tài),否則處于休眠狀態(tài)。這樣做主要是為了降低功耗,增加續(xù)航時間。所有的手持設備對功耗都很敏感,絕不可能讓語音識別功能一直處于工作狀態(tài)。
ST已經(jīng)和中國合作伙伴OpenAILab一起,將算法移植到了STM32L4、STM32F4、STM32F7和STM32H7平臺上。下面的視頻就是基于STM32L496的探索開發(fā)板。近場模型標準版只需要占用STM32L4 12MIPS, 200kB的Flash和26kB的RAM。


? ? 藍蝴蝶粉們,你們是不是也已經(jīng)開始了關鍵詞喚醒\語音識別的探索?你們手頭的方案使用什么硬件平臺?接口是怎樣的?面向什么有趣的應用?同為KWS\ASR的狂熱愛好者,我們對你有很多問號。
為了更好地了解開發(fā)者需求,我們特別發(fā)起此次KWS/ASR (關鍵詞喚醒/語音識別) AI專項調查。?本次調查問卷對象包括但不限于跟語音識別應用相關的客戶,僅需要幾分鐘,即可完成。您的反饋將為我們提供非常有價值的信息,可以幫助我們進一步改進STM32產(chǎn)品及服務。
活動時間:2020年6月24日-7月5日
活動禮品:32L496G探索板 10塊,小米移動電源10個
請掃碼參與問卷調查。

關注微信公眾號“STM32”了解最新信息
