五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

語音交互有哪些優(yōu)勢(shì)與劣勢(shì)?

2020-09-08 11:21 作者:深藍(lán)學(xué)院  | 我要投稿

轉(zhuǎn)載自公眾號(hào)【談人工智能】,轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán)

語音交互是指人與人、人與設(shè)備之間,通過自然語音進(jìn)行信息傳遞的過程。人與人之間通過語音來傳遞信息、交流感情等等,其實(shí)就是一種最基本的人與人之間的語音交互。

為什么VUI這個(gè)概念(Voice User Interface)在最近幾年又變得的火起來了呢?因?yàn)槿藗儼l(fā)現(xiàn)除了人與人之間可以通過語音來交互之外,已經(jīng)可以慢慢地對(duì)一些智能設(shè)備(如手機(jī)、智能音箱、車載系統(tǒng)等),通過語音進(jìn)行交互下達(dá)指令或者獲得反饋等,所以現(xiàn)在的語音交互的概念已經(jīng)不僅僅局限于人與人之間了。

尤其是對(duì)語音行業(yè)的研究來講,我們的注意力更主要的是集中在人機(jī)交互上,所以很多時(shí)候VUI這個(gè)概念就是特指人機(jī)語音交互。

語音交互的4點(diǎn)優(yōu)勢(shì)

那么,為什么我們要探討人機(jī)語音交互呢?是因?yàn)檎Z音交互本身獨(dú)有的優(yōu)勢(shì),我把它總結(jié)為這樣四點(diǎn)的優(yōu)勢(shì)

一、語音的輸入效率比較高

相比于傳統(tǒng)的鍵盤輸入、文字輸入,語音輸入的速度,語音輸入的效率至少是傳統(tǒng)輸入方式的三倍以上,這個(gè)是在百度開放平臺(tái)上做過的一個(gè)數(shù)據(jù)統(tǒng)計(jì)。

輸入效率高,體現(xiàn)在以下幾個(gè)方面:

1、通過語音去檢索信息的效率會(huì)比較高,尤其是針對(duì)復(fù)雜的query

在這種輸入方式不變的場(chǎng)景下,通過語音的交互效率會(huì)更高,比如說當(dāng)我在家里看電影的時(shí)候,我可以直接對(duì)著電視機(jī)說出我要看的電視節(jié)目或者是電影名稱。這種交互來講,通過語音的方式,直接下達(dá)指令會(huì)更方便。

2、語音交互可以跨空間,對(duì)于跨空間的交互方式更加便捷

跨空間的含義,我們可以簡(jiǎn)單地理解為遠(yuǎn)距離的語音交互,這里的一般稱之為遠(yuǎn)場(chǎng)語音交互或者是遠(yuǎn)講,遠(yuǎn)場(chǎng)的意思是說我的說話人距離我的設(shè)備的麥克風(fēng)的距離要比較遠(yuǎn),一般來講至少是1米以上,很多時(shí)候是3到5米,甚至是更遠(yuǎn)。

在這種跨空間的場(chǎng)景下,一般傳統(tǒng)意義上的文字交互,很多時(shí)候是不可能操作的。比如,當(dāng)距離智能音箱(手機(jī))比較遠(yuǎn)的時(shí)候,不可能通過文字的方式去進(jìn)行交互,所以在這種場(chǎng)景下,語音交互就顯得更加必要、高效。

3、語音支持組合指令輸出

即我們發(fā)出語音指令的時(shí)候,可以一次性的下達(dá)多條指令,然后由機(jī)器識(shí)別之后,分別去執(zhí)行這些指令的意圖。

舉一個(gè)例子,以家居的場(chǎng)景為例,我要看一部電影,其實(shí)可以對(duì)我的電視機(jī)這樣說:“播放周星馳的電影、電影要四星以上,并且都是免費(fèi)觀看的”。這樣一句話當(dāng)中,蘊(yùn)含了多個(gè)層次的含義。

這樣的話,通過語音,一句話就可以把我的多層次的指令通過組合的方式一起來下達(dá),并且智能機(jī)器會(huì)通過解析我的指令含義,去依次調(diào)用相應(yīng)的skill來滿足我的指令的下達(dá)方式。

這些就是語音輸入方式比傳統(tǒng)輸入方式效率高的原因。

二、解放雙手和雙眼,更安全

其實(shí)談到解放雙手,我們馬上會(huì)想到車載場(chǎng)景。其實(shí)對(duì)于車載場(chǎng)景來講,我們是絕對(duì)不可能在車上一邊開車一邊通過手機(jī)用手敲漢字的方式進(jìn)行交互的,這個(gè)也是絕對(duì)不允許的。在車載場(chǎng)景里,如果你想設(shè)置導(dǎo)航、聽音樂、聽廣播,也是必須要用語言來進(jìn)行交互的。而在現(xiàn)在很多的汽車上,其實(shí)也都已經(jīng)內(nèi)置了車載語音交互的功能。

除了車載場(chǎng)景之外,還有其他的場(chǎng)景,比如說醫(yī)療場(chǎng)景:醫(yī)生在跟病人或者病人家屬溝通病情時(shí),他可能同時(shí)雙手還要去操作各種各樣的復(fù)雜的醫(yī)療設(shè)備,那這時(shí)候,如果醫(yī)生需要記錄病歷,通過語音的方式來做就是一個(gè)比較必要的一種方式了。

三、使用門檻低

其實(shí)我們每個(gè)人都有經(jīng)驗(yàn),我們?nèi)伺c人之間的交互,最早本來就是用語言進(jìn)行交互的。一個(gè)還不會(huì)寫字的小孩子在慢慢長(zhǎng)大的過程當(dāng)中,與父母與其他的朋友之間的交互,都是通過語音來進(jìn)行的,這是一個(gè)我們?nèi)祟愄烊痪途邆涞慕换ツ芰Α?/p>

尤其對(duì)于小孩子、一些老人、一些有視覺障礙的人群,他們更是沒有辦法通過文字的方式來進(jìn)行交互,所以語音交互的方式會(huì)為這些人帶來非常大的便利。此外,語音交互的學(xué)習(xí)成本比較低,它的交互方式更加自然,所以它的上手成本也比較低。

四、可以傳遞更多的聲學(xué)信息

我們知道,一段語音不僅僅包含這段語音所承載的內(nèi)容信息,還包括其他的信息,比如聲紋信息、身份信息、性別信息(說這段話的人的是男是女)、年齡信息、情感信息(指的是人在說這段話的時(shí)候他的感情是怎么樣的,它是生氣的還是高興的還是悲傷的)等等。

這些信息都可以通過一段語音信號(hào)借助各種技術(shù)把它解析出來。那么相比于傳統(tǒng)文字的這種干巴巴的交互方式來講,語音它能夠傳遞的信息會(huì)更多。


語音交互的3點(diǎn)劣勢(shì)

這些就是語音交互的幾點(diǎn)優(yōu)勢(shì)。但是,對(duì)于一種交互方式,尤其是人機(jī)語音交互這樣一種新型的交互方式,自然也有一些劣勢(shì)

一、接收效率比較低

在剛剛的分析中,我們一直是集中在語音輸入的方式。而對(duì)于信息的接收,我們則是從輸出的角度來講的。語音的輸出其實(shí)是一個(gè)線性的輸出。

什么意思呢?也就是說當(dāng)你在聽別人說一段話的時(shí)候,你很有可能需要等到對(duì)方把這句話全部說完以后,或者是說完大部分以后,才能夠理解對(duì)方想說的話是什么意思。

文字交互則不太一樣。當(dāng)我們?cè)诳匆欢挝淖值臅r(shí)候,我們很可能會(huì)跳過一些沒有意義的文字,去直接掌握這段話的全局意思??赡艽蠹視?huì)有這樣的體驗(yàn),在用微信的時(shí)候,相對(duì)于收到的語音消息,更愿意閱讀一些文字的消息。

因?yàn)榭匆欢挝淖?,我們可以直接的很快速的去掌握這段文字的中心內(nèi)容,而如果我要去聽一段語音的話,那我必須要把這段語音從頭到尾的完整的聽完,我才能知道對(duì)方寫了講的是什么。所以這一點(diǎn)上,我們說語音輸出是一個(gè)線性的輸出,對(duì)于信息接收者來說,它的效率是比較低的。

二、環(huán)境復(fù)雜

我們面臨的各種各樣復(fù)雜的生活環(huán)境,這一點(diǎn)也是語音信號(hào)處理課程所要著重解決的一個(gè)問題。

我們每天都被各種復(fù)雜的環(huán)境所包圍。這些環(huán)境里可能會(huì)包含著各種各樣我們不需要或者是不想聽到的聲音。

當(dāng)這些聲音與我們想要聽的那些聲音交疊在一起的時(shí)候,就會(huì)對(duì)我們的交互體驗(yàn)產(chǎn)生非常大的影響,所以復(fù)雜的聲學(xué)環(huán)境是我們?cè)谠O(shè)計(jì)人機(jī)語音交互系統(tǒng)時(shí),所必須考慮的一個(gè)問題。

三、用戶的心理負(fù)擔(dān)

這一點(diǎn),也是對(duì)于語音交互設(shè)計(jì)者來說最難把握的一點(diǎn)。因?yàn)橛脩粼趯?shí)際使用這個(gè)人機(jī)交互系統(tǒng)的時(shí)候,他的很多行為往往是我們沒有辦法事先預(yù)期的。

對(duì)于同一個(gè)交互場(chǎng)景,不同人的交互方式很有可能會(huì)不一樣。從用戶的心理體驗(yàn)來說,可能會(huì)有一部分人的人機(jī)語音交互的習(xí)慣還沒有培養(yǎng)起來,也可能會(huì)有一些人,他不太愿意對(duì)著機(jī)器去通過語音來說話,尤其是身處在一個(gè)比較開放的需要顧及個(gè)人隱私的場(chǎng)景的時(shí)候更是如此。

總結(jié)

通過以上的內(nèi)容,我們可以了解到語音交互的本身是有它的優(yōu)勢(shì)的,當(dāng)然也有它不足的地方,而不足的地方正是需要我們?nèi)ブ亟鉀Q的一些問題。

特別感謝

本文整理自深藍(lán)學(xué)院《語音信號(hào)處理》課程,感謝宋輝老師的細(xì)心講解,以及深藍(lán)學(xué)院提供的優(yōu)質(zhì)課程,再次感謝!

語音交互有哪些優(yōu)勢(shì)與劣勢(shì)?的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國家法律
南京市| 铁岭市| 合阳县| 博白县| 驻马店市| 新丰县| 九寨沟县| 大港区| 论坛| 湟中县| 弥勒县| 清远市| 虞城县| 云和县| 海宁市| 丰台区| 丁青县| 五莲县| 奈曼旗| 米林县| 邵阳县| 凤城市| 祁东县| 鄂托克旗| 班戈县| 泰安市| 台中市| 林州市| 河北省| 来凤县| 晋州市| 临城县| 宁陵县| 南乐县| 同心县| 柳林县| 仁寿县| 安新县| 蒙城县| 澄迈县| 海淀区|