懂人性的語(yǔ)音融合交互來(lái)了 這個(gè)AliOS新科技我是佩服的
基于汽車(chē)駕駛安全所需的專注度和便捷性,語(yǔ)音交互正成為駕駛過(guò)程中最適用的交互方式,這已經(jīng)是業(yè)界共識(shí)。目前,AliOS在語(yǔ)音的分區(qū)識(shí)別、分人識(shí)別、方言識(shí)別、簡(jiǎn)化喚醒詞、語(yǔ)義理解等方面都日趨成熟。而未來(lái)的車(chē)載語(yǔ)音交互的發(fā)展絕不僅限于上述內(nèi)容。未來(lái)的語(yǔ)音交互應(yīng)該是什么樣子?會(huì)帶給用戶什么樣的驚喜?又會(huì)給互聯(lián)網(wǎng)汽車(chē)行業(yè)帶來(lái)怎樣的革新?AliOS多模態(tài)交互負(fù)責(zé)人王愷給出了答案。
自從車(chē)子有了導(dǎo)航以后,大家就很少記地址、路線了,更別提沿途有哪些大樓、商場(chǎng)、餐廳、學(xué)校、展覽館。所以,很多車(chē)主會(huì)開(kāi)車(chē),但不認(rèn)路。所以經(jīng)常會(huì)出現(xiàn)以下的場(chǎng)景:
下班的高架路上,左前方有座高樓大屏正在播放《超人總動(dòng)員2》電影預(yù)告片,這時(shí)激發(fā)了你想看電影的欲望。如果按照現(xiàn)有的導(dǎo)航功能,你得中斷當(dāng)前回家的導(dǎo)航,查找附近電影院,從而大致判斷這座大樓叫什么,再導(dǎo)航過(guò)去。
而AliOS的這項(xiàng)新科技,只需要你看著那幢樓說(shuō):“我想去左前方那幢樓看電影”,導(dǎo)航就立即準(zhǔn)確定位到那幢樓,并幫你預(yù)定好《超人總動(dòng)員2》合適場(chǎng)次、座位,甚至幫你找好停車(chē)位,預(yù)定好周邊餐廳。
這種交互的實(shí)現(xiàn),除了語(yǔ)音之外,還加入了語(yǔ)音與視覺(jué)圖形的融合。目前AliOS已經(jīng)從系統(tǒng)底層實(shí)現(xiàn)這一功能,通過(guò)融合車(chē)載顯示屏導(dǎo)航圖像或未來(lái)前擋玻璃的AR導(dǎo)航實(shí)景圖像,當(dāng)你開(kāi)車(chē)看到的某一地標(biāo),你都不需要知道這個(gè)地標(biāo)的名字和準(zhǔn)確方位,車(chē)子就知道你指的是哪一個(gè)地方、想去干嗎、能為你提前做什么。
這種看著說(shuō)的語(yǔ)音融合交互方式,除了導(dǎo)航外,也將被廣泛應(yīng)用于車(chē)載音樂(lè)、新聞廣播、有聲讀物、視頻瀏覽、車(chē)輛組隊(duì)、自駕游玩等多種場(chǎng)景。比如你隨機(jī)聽(tīng)歌的時(shí)候,可以直接做這些操作:“看下歌詞”、““收藏”、“單曲循環(huán)”、“下一首”、“許巍其他歌”等。
而且對(duì)于一些臉盲不熟明星的人,當(dāng)你看到某個(gè)畫(huà)面的時(shí)候,你可以直接問(wèn):這是誰(shuí)?
其實(shí),目前市場(chǎng)上在做的相關(guān)車(chē)載語(yǔ)音交互的技術(shù)研發(fā),更多的是讓機(jī)器準(zhǔn)確識(shí)別用戶發(fā)出的指令(包括同一時(shí)間不同用戶的指令),從而提供服務(wù)。但是,這個(gè)功能是單向和機(jī)械的。用戶發(fā)起,機(jī)器執(zhí)行。而且用戶還需要學(xué)習(xí)怎么去發(fā)出指令,機(jī)器才能理解。所以,這只能稱之為識(shí)別,并不算真正意義上的交互。
真正交互是什么?應(yīng)該是機(jī)器理解并滿足你發(fā)自本能的需求。這種理解,不單是對(duì)于某個(gè)指令自然語(yǔ)言的理解。應(yīng)該包括某個(gè)需求相關(guān)聯(lián)的前后場(chǎng)景、上下語(yǔ)義、甚至是習(xí)慣喜好的把握和判斷。而且這個(gè)過(guò)程中,機(jī)器還能幫你記得你剛剛在做什么,隨時(shí)等你繼續(xù)。
大家都有轉(zhuǎn)身忘事的經(jīng)歷:當(dāng)被打岔或分心之后,不記得之前要做什么。比如,你想著導(dǎo)航回家,或調(diào)出歌單聽(tīng)某首歌,或叫個(gè)外賣(mài)到家。但開(kāi)車(chē)過(guò)程中,往往會(huì)有很多意想不到的事情,比如突然來(lái)電話了、或邊上的乘客和你說(shuō)話、或前面有車(chē)子變道你要避開(kāi)。這時(shí)候你就會(huì)忘了之前要干嗎?哪怕好不容易想起來(lái),也不得不重新打開(kāi)應(yīng)用再說(shuō)一遍指令。因?yàn)槟壳暗能?chē)載語(yǔ)音交互都有響應(yīng)時(shí)間,超時(shí)沒(méi)給出指令就退出了。
而AliOS的系統(tǒng)能力是從底層開(kāi)始就涵蓋所有這些領(lǐng)域,哪怕你在使用過(guò)程中被打斷,沒(méi)關(guān)系,系統(tǒng)一直在等你?;仡^只用一句“剛才我想干嗎”、“繼續(xù)導(dǎo)航”、“換第三首”、““就剛才那單(外賣(mài))”就可以繼續(xù)你之前未完成的操作,無(wú)論中間間隔多久,也不用重新啟動(dòng)。
據(jù)介紹,上述的科技能力將在幾個(gè)月后正式落地應(yīng)用。這也是AliOS系統(tǒng)與其他車(chē)載系統(tǒng)的不同之處,讓車(chē)載交互回歸本能。其背后是整個(gè)阿里巴巴集團(tuán)以及其他合作伙伴的龐大業(yè)務(wù)生態(tài)和科技能力的融合共生。AliOS從誕生之日起,就擁有了同步阿里云、支付寶、高德地圖、口碑、蝦米音樂(lè)、優(yōu)酷視頻、天貓?zhí)詫毿铝闶鄣葮I(yè)務(wù)生態(tài)的底層系統(tǒng)級(jí)的語(yǔ)音交互能力。而這種底層系統(tǒng)能力還在不斷開(kāi)放給其他合作伙伴,讓系統(tǒng)“本能”更具開(kāi)放性、包容性、學(xué)習(xí)力和創(chuàng)造性。
