于繼棟:輪子現(xiàn)在還沒有出來。
艾媒網(wǎng):去年聽說在研發(fā)?
于繼棟:現(xiàn)在還是有問題,就是我們現(xiàn)在大家都認(rèn)為身高沒有達(dá)到一定程度,如果這么小的話放在桌子上也沒有用。
艾媒網(wǎng):新一代我還沒有見到,F(xiàn)在很多需要用語音入口的東西都要用到科大訊飛的技術(shù),你們自己有沒有說怎么去把這些廠商聯(lián)合起來?把家居智能的水平提高一個檔次?
于繼棟:現(xiàn)在有這個想法,但是技術(shù)還在突破,我們現(xiàn)在正在做一個AIUI的智能交互的系統(tǒng)。原來的語音識別技術(shù)你可能都用過,點(diǎn)一下再說,說完了再點(diǎn),這很不方便,那個時候是為了手機(jī)設(shè)計(jì)的,但是在實(shí)際智能家居場景是完全不適合這個習(xí)慣的。我們現(xiàn)在研發(fā)是完全是脫離式的,和人一樣隨時跟他交流,可以不間斷的,我可以說多次,我還可以隨時打斷你。我們其實(shí)去年有發(fā)布AIUI的原形,最近可能會發(fā)布它的產(chǎn)品。希望通過這樣的交互改進(jìn),能夠讓大家在這塊的投入更多,讓這個產(chǎn)業(yè)發(fā)展的更快一點(diǎn)。
艾媒網(wǎng):其實(shí)很多技術(shù)我們現(xiàn)在在實(shí)驗(yàn)室里面體驗(yàn)很好,或者感覺到很先進(jìn)的樣子,當(dāng)我們具體在生活當(dāng)中用的時候總是會感覺到有點(diǎn)距離,像語音識別,我還得按一下?拼笥嶏w在最后這種跟用戶對接的人機(jī)交互的便利性方面會做一些什么事情?
于繼棟:交互事情上做的第一個是遠(yuǎn)場,大概3米以上的距離,第二個是抗噪,一個是家庭里面各種各樣的聲,電視背景,小孩聲音,還有多人的聲音,還有傳輸,就跟人一樣,我說話你可以找到我。
艾媒網(wǎng):可不可以介紹一下里面的原理,感覺很不可思議,遠(yuǎn)場,很多噪聲,不同的人在講話,可能有一個家庭里面的主人,他在發(fā)布命令的人,然后大家一起說話。當(dāng)主人提到什么事情的時候他可以去做?可以識別呢?
于繼棟:我們4+1麥克風(fēng)陣列技術(shù),在家里面你叫這個硬件的名字的時候,它會實(shí)現(xiàn)聲源定位,那個時間就會只聽你的聲音。其他人都會被抑制掉,這個時候如果有另外一個人再打斷可能就會采集。
上篇:
下篇: