行業關注
Industry Focus

為什麼智能語音把IOT盤活了

前兩天蔣總的朋友問我(wǒ)(wǒ),如何在自己的豪宅布置智能家務慢居(真是紮心)。交流了各種協議走線問題後,我(花技wǒ)(wǒ)問他控制中(zhōng)心怎兵器麼做,豪哥提出打算用美帝的Control4的觸控面闆。屌絲終于在此刻找到了自豪師男感,我(wǒ)(wǒ)淡淡地告訴他,自從用了粗糧家的『小(xi紅制ǎo)愛同學』,家裡的無線開(kāi)關已經開(kāi)始積灰了,間厭更不用提智能家庭App了。

為什麼智能語音把IOT盤活了

雖然無法精确度量,但喜歡窩在沙發上看國劇的我(wǒ)(wǒ),本能地發現說一空村(yī)句『小(xiǎo)愛同學,關閉客廳的燈』要比伸手去靜山(qù)找遙控器(或者遙控器替代品)要省時省力,耗能少。某聲開秒學項目的FA曾嚴謹地比較過不同交互方式的優劣(當然他們的結論是Voi黃去ce First)。 我(wǒ)(wǒ)的理解是,不同的任務,有熱空不同的最佳交互路徑,例如對于複雜(zá)的長時間輸入(例如寫這說作篇文章,或是coding),目前的軟件仍然需要鍵盤的支持。對慢行于多輪次複雜(zá)邏輯的交互,由于視覺的反饋很快,觸控也門我具有一(yī)定優勢(例如重設一(yī)部手機,或是在App上買機票(p答了iào))。但如果是單輪輕度輸入,語音的優勢就會很明顯(例如,讓小(我你xiǎo)愛/Siri幫忙設置早上7點的鬧鐘,絕對是Killer App)。拿東更有趣的是,在這個場景下(xià)語音将複雜(zá高土)的輸入設置(早晨,7點,每天重複,确認)合并了,一(yī)氣呵成好到,妙不可言。

為什麼智能語音把IOT盤活了

但真正讓智能語音用起來的,并非單純的識别技術,甚著離至不是玄妙的智能對話(huà),我(wǒ)(wǒ河媽)覺得是這種交互第一(yī)次突破了距離(lí)的限制。能夠躺在床上/在不沙發上随意發号施令,之前隻能由『真人助理』來花近完成。雖然早幾年的Siri等一(yī)票(pi科體ào)語音助手希望解決同樣的問題,抛開(kāi)時不時的答遠家非所問不講,單純拿起手機按下(xià)Home鍵再舉到嘴邊這個動作黑費,就已經很令人掃興了。

為什麼智能語音把IOT盤活了

相反地,紅樓夢在王熙鳳出場時,用到了『粉面含春威不露,紙飛丹唇未啟笑先聞』這句詩。可以想象,當鳳姐還遠在屏輛書風之後時,笑聲已然傳來;同樣的,主人在卧室看書(shū),也可以樹答通過語音把客廳的燈和電(diàn)視關掉。之前曾有人希望通過視用紅覺或超聲波做『隔空手勢識别』,相對于同樣遠距離(lí影地)的語音,使用的複雜(zá)度和學習成本都太高了。民體

遠場的一(yī)系列功能是如何實現的呢?為什麼明喝之前的語音助手都是近距離(lí)的呢?引用相海問非老師的技術架構圖,在進行語音識别(包括本地和雲端)舞報之前,有一(yī)系列複雜(zá)的聲學前端算法,包些自括:

  • 回波抵消(去(qù)除音箱自己播放(fàng)北人的音樂)

  • 波束形成(隻聽(tīng)人說話(huà)的那個方向,去(q錢美ù)除其他方向的幹擾)

  • 去(qù)混響(簡單理解為去(qù)除桌椅闆凳的聲音反射農劇)

  • 聲紋識别(爸爸在說還是媽媽在說)等

經過這一(yī)系列的聲學處理,相對『幹淨』的語音信号才會進器跳入負責喚醒的模型,喚醒之後才會進一(yī)步地來飛進入雲端負責語音識别的模型。

為什麼智能語音把IOT盤活了

這一(yī)交互涉及到了:

  • 物(wù)理硬件層(聲腔結構設計,麥克風陣列設計)

  • 信号層(上述聲學處理)

  • 後續的數據層(語音識别,NLP,TTS等)為體

這三層分(fēn)别需要物(wù)理聲學,信号處理,和計算機專弟說業三個領域的人才相互配合,是個相當複雜(zá)的工(g他也ōng)程。這還隻是語音技術層面,作為消費(fèi)級産品,一(yī)款音腦廠箱想要達到好的效果,還涉及到産品層,和産品之上應用層面的一(yī)系列答票問題。

為什麼智能語音把IOT盤活了

亞馬遜号稱已經投入5000人的研發團隊,另外(wài)還有1000個職位白算Open,地主家的餘糧還是多多的。當然,貝索斯敢于如此投入,也和Al紙影exa一(yī)騎絕塵的戰績相關,目前根據三方統計,貝爺家的各種音箱已經出貨快紅1500台以上,這還不包括通過AVS認證的第三方設備(大(dà)概在400-唱風500萬台之間),整個市場占有率應該在70-80%。更有殺傷力的是,什都随着出貨量的增長,Skills(類似手機上Apps)的數量也幾乎同步了間增長,看來已經形成了『硬件-系統-軟件』的正循環。

為什麼智能語音把IOT盤活了

回到本文的主題。IOT喊了很多年,從20年前的智能家居,務電到09年無錫落地的物(wù)聯網産業園,再到14年火(huǒ)熱的件紙智能家居創業,乃至去(qù)年底孫正義大(dà腦睡)神提出鞋子比人更聰明,IOT都處在隻打雷不下(xià)雨的尴尬狀離計态。之前我(wǒ)(wǒ)的認識是『雲——網——端』三黑我層中(zhōng)端的密度不夠,即設備數量還不夠多,從而數據量不夠大(dà),謝知和人接觸點也不夠多。

為什麼智能語音把IOT盤活了

但根據小(xiǎo)米公布的數據,MIOT在16年城事底大(dà)約5000萬入網設備,17年中(zhōng)6000萬短兵,17年11月開(kāi)發者大(dà)會上講是800亮藍0萬。5000萬和8000萬我(wǒ)(wǒ)覺得并沒有本質的差别,但紙海融入了智能語音交互後,原先的App指令控制,傳感器觸發在輛,變成了遠場語音控制。這樣一(yī)來,用北交互界面從單一(yī)的手機App(家裡不方便),傳近會感器觸發(冷冰冰且不豐富),擴展到了無處不在的語音指令(方便且有溫度)。這就冷大(dà)概解釋了小(xiǎo)米開(kāi)發者大(dà)會場面火(huǒ也下)爆的原因吧。

為什麼智能語音把IOT盤活了

當然,語音交互絕不止是遠距離(lí)版的遙年森控器而已。再借用相非老師一(yī)張圖,獨立于智能家居的硬件設備外技海(wài),語音交互有機會将随身設備,車(chē)載設備熱這,乃至互聯網的一(yī)系列服務串起來。例如,我(wǒ)(w資火ǒ)們可以在車(chē)裡通過語音提前把外(wài南林)賣點好(真是屌絲福音),或是在跑步時通過耳機把家裡的熱水器打開(k土答āi)(目前還需要解決低功耗喚醒問題),或是在家快兒通過音箱把凱叔召喚出來給孩子講故事(已經實現)。

為什麼智能語音把IOT盤活了

或許,技術本身就是讓原本少數人的特權(鋼鐵俠愛店的Javis)飛入尋常百姓家。能夠見證這一(yī)過程,一時的确令人興奮。


Top