圖片來(lái)源:視覺(jué)中國(guó)

 

在最近谷歌的Google I/O大會(huì)上,谷歌CEO“劈柴“直接祭出了這次大會(huì)的王牌AI,這個(gè)AI產(chǎn)品似乎像人們展現(xiàn)了人工智能技術(shù)的進(jìn)一步提升,Assistant的“持續(xù)性對(duì)話”功能讓對(duì)話更自然,而“多重行動(dòng)”功能讓用戶(hù)在一次對(duì)話中可以提出多個(gè)問(wèn)題。

這似乎是一個(gè)標(biāo)志性的轉(zhuǎn)變,存在對(duì)話生硬、無(wú)法多輪對(duì)話等諸種弊病的語(yǔ)音助手在這場(chǎng)GoogleI/O大會(huì)上表現(xiàn)的尤為智能。相比Apple Siri和Microsoft Cortana只能機(jī)械式對(duì)話的語(yǔ)音互動(dòng),Google Assistant似乎表現(xiàn)尤為優(yōu)異(至少在發(fā)布會(huì)上),那么,Google Assistant的出現(xiàn)是谷歌在AI語(yǔ)音助手領(lǐng)域的一張王牌嗎?

驚艷全場(chǎng)的“嗯哼”

想要探究AI語(yǔ)音助手的智能程度,其評(píng)判標(biāo)準(zhǔn)就是如何做到讓AI“像人”,這是一個(gè)深度學(xué)習(xí)的能力問(wèn)題,而體現(xiàn)在表現(xiàn)形式上則為“話術(shù)”,如何能夠讓語(yǔ)音助手真正突破“圖靈測(cè)試”,讓用戶(hù)人機(jī)難辨。然而,當(dāng)下Google Assistant似乎正朝著全面“類(lèi)人化”的方向發(fā)展。

以Google Assistant在GoogleI/O大會(huì)上的表現(xiàn)為例,發(fā)布會(huì)上,用戶(hù)對(duì)Google Assistant說(shuō):我想剪頭發(fā)。Google Assistant接受指令后直接幫你電話預(yù)約。

Google Assistant先撥通了Jim理發(fā)店的電話,進(jìn)行電話預(yù)約剪發(fā)。

Google Assistant:你覺(jué)得時(shí)間定為3號(hào)可以嗎?

理發(fā)店:我需要查查Jim老師的檔期,稍等。

Google Assistant:嗯哼?

這一句“嗯哼”讓全場(chǎng)所驚艷,AI的反應(yīng)似乎出乎了所有人的預(yù)料,然而,這一切并沒(méi)有結(jié)束。

理發(fā)店:3號(hào)12點(diǎn)不行,Jim老師已經(jīng)有預(yù)約了。

Google Assistant:那10點(diǎn)到12點(diǎn)這段時(shí)間呢?

理發(fā)店:您的顧客是想燙頭發(fā)還是剪頭?

Google Assistant:只是簡(jiǎn)單修剪一下。

理發(fā)店:那沒(méi)有問(wèn)題,我們10點(diǎn)見(jiàn)!

誠(chéng)然,對(duì)于人類(lèi)來(lái)說(shuō),此類(lèi)“嗯”、“呃”之類(lèi)的語(yǔ)氣詞是再正常不過(guò),可是對(duì)于機(jī)器而言,這是一件難以做到的事情。事實(shí)上,Google Assistant說(shuō)“嗯嗯”,好似在點(diǎn)頭同意;而其所拉長(zhǎng)的某些詞的發(fā)音,又好像它正在花時(shí)間去思考一個(gè)問(wèn)題的答案,當(dāng)然,這一切都是是由編程算法即時(shí)實(shí)現(xiàn)的。

谷歌助手的背后是一種稱(chēng)之為“Duplex”的技術(shù),這由紐約、特拉維夫和山景城的谷歌工程師和產(chǎn)品設(shè)計(jì)師聯(lián)合開(kāi)發(fā),該技術(shù)可實(shí)現(xiàn)一小部分人可以完成預(yù)訂餐廳、查看假日時(shí)間等通常通過(guò)電話進(jìn)行的活動(dòng)。所有這些交互都發(fā)生在后端——谷歌數(shù)字助理Assistant和餐廳之間。

此外,Google Assistant除了一種男性發(fā)音和女性發(fā)音外,其還可以用六種聲音說(shuō)話。谷歌還使用戶(hù)能夠更輕松地提出后續(xù)問(wèn)題,并在開(kāi)車(chē)并使用谷歌地圖時(shí)自動(dòng)向某些人發(fā)送你的預(yù)計(jì)抵達(dá)時(shí)間。

Google Assistant真的“完美無(wú)缺”嗎?

Google Assistant新技術(shù)的應(yīng)用,許多人認(rèn)為“這下真的分不清對(duì)面對(duì)面是人是狗了”,但是,Google Assistant顯然并不是完美無(wú)瑕,皮查伊在開(kāi)發(fā)者大會(huì)上展示的demo距離落地還有多遠(yuǎn)?所展示的GoogleAssistant落地后真的會(huì)如此驚艷嗎?

智能相對(duì)論分析師柯鳴認(rèn)為,谷歌語(yǔ)音助理雖然已經(jīng)突破了眾多技術(shù)瓶頸,但其真正能夠應(yīng)用于生活場(chǎng)景中,并完全替代“人類(lèi)助理”,依然尚需時(shí)日。

首先,google duplex似乎已經(jīng)可以解決自然對(duì)話的問(wèn)題。展開(kāi)一段自然的對(duì)話有這么幾個(gè)難點(diǎn):自然語(yǔ)言難以理解,人類(lèi)的自然行為很難建模,人類(lèi)對(duì)延遲的耐受性很低所以需要高處理速度,以及生成聽(tīng)起來(lái)自然的語(yǔ)音,其中還要適當(dāng)?shù)貖A雜一些語(yǔ)氣詞。

谷歌聯(lián)合使用了一個(gè)級(jí)聯(lián) TTS 引擎和一個(gè)生成式 TTS 引擎(其中使用了 Tacotron和WaveNet),根據(jù)不同的情境控制語(yǔ)音的語(yǔ)調(diào)。

為了讓語(yǔ)音變得更加親切自然,這個(gè)系統(tǒng)能夠生成一系列語(yǔ)氣詞,這也是讓大家所驚嘆的地方,比如“hmmm”、“uh”等語(yǔ)氣詞。

當(dāng)級(jí)聯(lián)TTS需要組合變化很大的語(yǔ)音單元,或者需要增加生成的停頓時(shí),語(yǔ)氣詞就會(huì)被添加到生成的語(yǔ)音中,這就讓這個(gè)系統(tǒng)可以以一種自然的方式向?qū)Ψ绞疽?ldquo;是的我聽(tīng)著呢”或者“我還在考慮”(人類(lèi)說(shuō)話的時(shí)候就經(jīng)常在思考的同時(shí)發(fā)出一些語(yǔ)氣詞)。谷歌的用戶(hù)調(diào)查也確認(rèn)了人類(lèi)覺(jué)得帶有語(yǔ)氣詞的對(duì)話更熟悉、更自然。


Duplex的運(yùn)作模式

但是,也正是TTS的表現(xiàn)讓人覺(jué)得其仍有可商榷之處。如從自然語(yǔ)言訓(xùn)練的方法角度看,通過(guò)充分的數(shù)據(jù)梳理,借助機(jī)器學(xué)習(xí)在某個(gè)單一領(lǐng)域窮舉各種情況,繼而達(dá)到Google 在今天所展示的效果尚有可能。

但目前沒(méi)有公司可以做到全方位理解各種場(chǎng)景。也就是說(shuō),Google Assistant所擅長(zhǎng)的也是針對(duì)特定場(chǎng)景的,例如預(yù)訂餐位和

這能否在所有場(chǎng)景中具有普適性,目前理發(fā)。依然無(wú)法得知。從這個(gè)角度來(lái)看,小場(chǎng)景有限話題模擬對(duì)話并不是難題,針對(duì)demo優(yōu)化到流暢也能夠做到,這是否能夠真正替代“人類(lèi)助理”,依然是一個(gè)尚未確知的問(wèn)題。

其次,從倫理和信息安全的的角度來(lái)看,Google Assistant依然存在著諸多爭(zhēng)議。比如,谷歌官方曾表示:“現(xiàn)在的技術(shù)并沒(méi)有達(dá)到只通過(guò)與開(kāi)發(fā)人員對(duì)話就學(xué)會(huì)如何像人一樣說(shuō)話的水平,為了獲得高精度,我們?cè)谀涿娫挼臅?huì)話數(shù)據(jù)庫(kù)上對(duì)Duplex的RNN進(jìn)行了訓(xùn)練。”

在數(shù)百個(gè)小時(shí)的訓(xùn)練過(guò)程中,它記錄下了客戶(hù)們電話中的通話記錄。這讓我們又一次回到了十年來(lái)一直在進(jìn)行的辯論,即維護(hù)個(gè)人數(shù)據(jù)隱私和推進(jìn)技術(shù)便利的界限究竟在何處,F(xiàn)acebook的信息泄露案更將這個(gè)問(wèn)題推到了風(fēng)口浪尖。

當(dāng)然,倘若撇開(kāi)公地悲劇的存在主義解決方案不談,Duplex AI的出現(xiàn)還暴露了許多實(shí)際問(wèn)題。例如,如何防止某人非法利用公眾人物的錄音來(lái)訓(xùn)練人工智能,并生成偽造的音頻?

此外,我們還需要防止偽造視頻的攻擊,鑒于人們已經(jīng)能夠偽造圖像和視頻(甚至色情),并能夠合并一層虛假音頻,谷歌和Facebook的內(nèi)容審核工作將面臨著更大的困難。 

谷歌這條路好走嗎?

谷歌語(yǔ)音助手這條路,已經(jīng)走了很久。最早的GoogleNow作為谷歌語(yǔ)音助手的最初形式出現(xiàn)在人們面前,Google Now2012年最早出現(xiàn)在安卓4.1和Nexus手機(jī)上,隨后又推出面向移動(dòng)設(shè)備信息快速檢索服務(wù)的“Now On Tap”、以及“Now cards”。

從2016年開(kāi)始,Google Assistant就開(kāi)始逐步取代Google Now,相應(yīng)的功能也被替換,“Now cards”被“Feed”取代,“Now on Tap”被“Screen Search”所取代。

最早于2016年與Google Home一起亮相的Google Assistant,依托著谷歌系產(chǎn)品的用戶(hù)量級(jí),雖然同類(lèi)競(jìng)品亞馬遜的Echo已經(jīng)占據(jù)一定市場(chǎng),但是依然有著一定發(fā)展的前景和底氣。

但是,如果谷歌的目標(biāo)是讓Assistant成為擬人化的谷歌,那么仍有很多事情要做。若想實(shí)現(xiàn)與斯派克·瓊斯(Spike Jonze)科幻電影《她》(Her)中的操作系統(tǒng)Samantha進(jìn)行對(duì)話的那樣,谷歌依然還有一定距離。、

當(dāng)然,相較于市場(chǎng)上同類(lèi)系的其他產(chǎn)品,Google Assistant的表現(xiàn)確實(shí)稍顯優(yōu)秀。Stone Temple Consulting與ROAST公司2018年發(fā)布的智能語(yǔ)音助理測(cè)試報(bào)告也顯示,Google Assistant手機(jī)版能回答的題目最多,高達(dá)90%,準(zhǔn)確率也有將近80%的超高表現(xiàn)。


來(lái)源:Stone Temple Consulting、ROAST測(cè)試報(bào)告

來(lái)源:Stone Temple Consulting、ROAST測(cè)試報(bào)告

其實(shí),嚴(yán)格來(lái)說(shuō),谷歌的競(jìng)爭(zhēng)對(duì)手Alexa,Siri和Cortana都沒(méi)有兌現(xiàn)他們的承諾。Alexa,Siri等都存在著或大或小的問(wèn)題,每個(gè)產(chǎn)品在市場(chǎng)中的表現(xiàn)似乎都沒(méi)有人們想象中的優(yōu)異。

當(dāng)然,谷歌并非第一個(gè)進(jìn)入語(yǔ)音助理領(lǐng)域的公司。作為后來(lái)者,CIRP公司的數(shù)據(jù)顯示,2016年發(fā)布的GoogleHome占有31%的市場(chǎng)份額,較之亞馬遜的69%的市場(chǎng)份額稍顯不足。

總的來(lái)說(shuō),“AI很好,但不夠驚人”,始終是近年來(lái)籠罩在AI語(yǔ)音市場(chǎng)上的濃重陰影。當(dāng)然,隨著日后GoogleAssistant新技術(shù)的逐漸應(yīng)用,這是否能夠成為谷歌新的“殺手锏”仍需時(shí)間檢驗(yàn),而谷歌語(yǔ)音助理的這條路,也將堅(jiān)定的走下去。(本文首發(fā)鈦媒體)

【鈦媒體作者介紹:柯鳴/智能相對(duì)論(微信id:aixdlun)。深挖人工智能這口井,評(píng)出咸淡,講出黑白,道出vb深淺。重點(diǎn)關(guān)注領(lǐng)域:AI+醫(yī)療、機(jī)器人、智能駕駛、AI+硬件、物聯(lián)網(wǎng)、AI+金融、AI+安全、AR/VR、開(kāi)發(fā)者以及背后的芯片、算法、人機(jī)交互等?!?/p>

本文系作者 智能相對(duì)論 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶(hù)分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

22:22

海南自由貿(mào)易港民營(yíng)企業(yè)座談會(huì)舉行

22:12

中國(guó)科學(xué)院院士:全固態(tài)電池或至少再等5年

22:11

今年以來(lái)逾1370萬(wàn)人次旅客訪港

22:08

下周(3月30日-4月5日)市場(chǎng)大事預(yù)告

22:06

民調(diào)顯示美國(guó)選民對(duì)特朗普“不滿意率”創(chuàng)新高

21:43

納比勒·法赫米將擔(dān)任新一任阿盟秘書(shū)長(zhǎng)

21:07

群核科技通過(guò)港交所聆訊:2025年實(shí)現(xiàn)盈利,沖刺“全球空間智能第一股”

21:05

油價(jià)飆升埃及多措施節(jié)能,埃及上調(diào)公共交通票價(jià)

21:05

英矽智能與禮來(lái)達(dá)成AI藥物研發(fā)合作,交易總值最高可達(dá)27.5億美元

21:04

3月29日新聞聯(lián)播速覽20條

21:01

中國(guó)銀河證券:中長(zhǎng)期仍看好科技板塊產(chǎn)業(yè)驅(qū)動(dòng)與周期板塊漲價(jià)線索的雙主線

20:34

大風(fēng)、降水來(lái)襲,長(zhǎng)江江蘇段部分區(qū)域?qū)嵤┡R時(shí)交通管制

19:59

國(guó)航C919正式投入北京—廈門(mén)、北京—哈爾濱兩條航線運(yùn)營(yíng)

19:57

中鋁國(guó)際:2025年歸母凈利潤(rùn)2.58億元,同比增長(zhǎng)16.47%

19:19

伊朗稱(chēng)已打擊與美軍工有關(guān)聯(lián)的兩家企業(yè)

18:36

伊朗與巴基斯坦兩國(guó)外長(zhǎng)通電話,討論地區(qū)局勢(shì)

18:35

2025年玩具(不含潮玩)國(guó)內(nèi)市場(chǎng)零售總額達(dá)1035.3億元

18:08

全國(guó)豬價(jià)跌破5元,創(chuàng)歷史新低

18:07

時(shí)代天使2025年實(shí)現(xiàn)收入3.7億美元,同比增長(zhǎng)37.8%

17:57

電魂網(wǎng)絡(luò):擬投資4920萬(wàn)元取得上海漫魂51%股權(quán)

1

掃描下載App