圖片來源:視覺中國

在鈦媒體在線課“鈦坦白”第40期,我們請來了三位鈦客,分享AlphaGo與柯潔“人機大戰(zhàn)”勝負之外的更多思考。本期鈦客之一、搜狗基礎(chǔ)平臺負責(zé)人、機器人負責(zé)人武健,畢業(yè)于清華大學(xué),2009年加入搜狗,先后負責(zé)搜狗瀏覽器、機器人等公司級重大項目。其參與主導(dǎo)的“搜狗汪仔”機器人,在“一站到底”節(jié)目播出后引起行業(yè)關(guān)注與討論。

本文節(jié)選自武健在鈦坦白的分享。如果您還不是鈦媒體Pro用戶,希望查看鈦坦白所有干貨,進入鈦坦白九個專業(yè)群交流,并查看更豐富的專業(yè)數(shù)據(jù)和信息,可點擊:http://m.chcmb.cn/pro 注冊。

以下根據(jù)武健在鈦坦白的分享實錄整理:

大家好,很高興今天晚上在鈦坦白跟大家聊聊人工智能。我叫武健,畢業(yè)于清華大學(xué)。畢業(yè)之后一直在搜狗工作,從去年開始主導(dǎo)了搜狗汪仔機器人的項目,參加了“一站到底”,目前節(jié)目已經(jīng)播出了半年時間,效果很好,引起了很多人的關(guān)注。

我相信在若干年前,當(dāng)大家聊起機器人時,腦海里浮現(xiàn)出來的可能是這樣的場景:

這些機器人看著都很炫酷,也非常高級,但感覺離我們的真實生活是非常遠的。今天,如果我再跟大家說機器人,大家可能想到的就是這樣的場景了:

誠然,工業(yè)機器人還在它所在的領(lǐng)域發(fā)揮著巨大的作用,這點是毋庸置疑的,但是人們的注意力已經(jīng)轉(zhuǎn)移到各種聊天機器人、陪伴機器人、服務(wù)機器人以及教育機器人上面了。

對于機器人的定義與理解

在科技界,科學(xué)家會給每個科技屬一個明確的定義。機器人問世已經(jīng)有幾十年了,但是對于它的定義仍然仁者見仁智者見智,沒有統(tǒng)一的意見,原因之一是機器人還在發(fā)展,新的機型和功能不斷的涌現(xiàn)出來。

但我覺得根本原因,是“機器人”涉及到了“人”的概念,成為一了個很難回答的哲學(xué)問題。機器人這個詞,最早誕生于科幻小說之中,人們對機器人充滿了幻想。也許正是因為對機器人定義的模糊,才給了人們充分的想象和創(chuàng)造空間。

不管怎么樣,我姑且先把之前提到的這幾種機器人統(tǒng)稱為智能機器人,即人工智能機器人??赡苡腥藭氲降资裁词侨斯ぶ悄苣兀课蚁仍谶@里賣個關(guān)子,咱們最后再來討論這個問題。

智能機器人跟我們之前提到的這種工業(yè)機器人有什么區(qū)別呢?在我來看,最重要的一點是智能機器人是擁有非常發(fā)達的大腦的。

那么我們可以接著往下繼續(xù)深入的思考一下,到底擁有什么樣的能力才算擁有了大腦?因為不同的人對于大腦的理解也是不一樣的,我提一些個人的想法。

人工智能機器人的關(guān)鍵能力

如果讓我來定義的話,我覺得人工智能機器人至少要擁有兩個關(guān)鍵的能力:

基于剛才我提到的這兩點,一個是交互能力,一個是思考的能力,來重新思考這個機器人的定義,那么滿足這兩個條件恐怕就不僅僅限于我剛才照片里發(fā)的那些擁有真實物理形態(tài)的機器人了。

所以在我看來,智能機器人重要的不是是否擁有運動能力,能舉起多重的東西,是否能跳起來,而是看這個東西在跟誰打交道,怎么打交道。如果一個不是人類的東西能夠跟人類正常的交往,那么我其實就很愿意叫它為機器人。當(dāng)然我想在這里強調(diào)一下我并沒有提起是否要滿足圖靈測試這一點,我個人認為在現(xiàn)階段要滿足圖靈測試還是一個夢想,拿圖靈測試來做一個東西的評判標準還是不太合適的,所以說我們可以把這個標準放低一點,來看這個事情。

智能機器人的交互能力

我剛才提到了智能機器人的重點是要跟人類打交道,那么跟人類打交道里面最重要的是什么呢?大家來看機器人這個詞,把它拆開是機器+人來組成的,機器二字突出的是什么呢?突出它的確是一個非人類,是一個物體。但是人字又體現(xiàn)出我們其實希望它是個人,更準確的說它像個人。那么你在跟一個東西進行交流時,它怎么樣才能像個人呢?

其實最基本的一點就是機器在跟人打交道時它要表現(xiàn)得很自然,我們把這種交互方式叫自然交互。怎么樣的交互才叫自然的呢?是說這個學(xué)習(xí)成本越低越好,這個交互越接近人類的本能越好,還是說我們要從信息的輸入和獲取的方式上來判斷呢?

我們回過頭來看過去幾十年計算機的發(fā)展以及人和機器交互方式的演化,從純文字的命令行窗口,到有圖形的視窗+鼠標控制輸入,再到后來的視窗+接屏控釋,我們不難發(fā)現(xiàn),其實人和機器之間的交流的學(xué)習(xí)成本在不斷的降低,人機交互變得越來越接近人的自然能力。

今天,語音其實正在成為一個最自然的交互方式。馬麗米克在2016年的互聯(lián)網(wǎng)趨勢報告就提到了:"語音應(yīng)當(dāng)是最有效的輸入計算形式,在2015年,美國使用過語音助手的用戶比例已經(jīng)達到65%。在這些使用語音的用戶中有43%的人是在家中使用。"隨著技術(shù)的進步和語音效果的提升,這兩年比例還在持續(xù)的擴大中。我相信在座一定都用過語音輸入這個方式。

人們使用語音的場景有很多,比方說開車時候你的雙手雙眼都被占用了,在客廳里面,有些設(shè)備可能就沒有傳統(tǒng)的這種鍵盤輸入,在戶外行走的時候打字很慢等等。說到這里,我必須暫停一下,向偉大的蘋果公司致敬,剛才我們提到的每一個新的交互形態(tài),都是由蘋果在工業(yè)界點燃的。通過自然語言來進行知識信息獲取和服務(wù)的,蘋果可能不是第一家,但它一定是開啟時代的那一家。當(dāng)然互聯(lián)網(wǎng)上有很多關(guān)于"為什么只有蘋果才能做出如此創(chuàng)新"的文章,數(shù)不勝數(shù),大家都有自己的理解,我們這里就不再深入去聊了。

如何做好自然交互?

對于這種開放式的問題其實并沒有唯一的答案,我也只是結(jié)合搜狗在做的事情談一些心得和體會。

在我看來,自然交互的本質(zhì)其實就是人工智能,而有價值的人工智能 = 技術(shù) + 計算力 + 數(shù)據(jù) + 產(chǎn)品。所以,自然交互= 技術(shù) + 計算力 + 數(shù)據(jù) + 產(chǎn)品。這里的有價值的人工智能,指的是能夠以真實的產(chǎn)品形態(tài)滿足用戶需求的,而決不是停留在實驗室里面的那些原型。

在我剛才提到的模型里面,技術(shù)是很重要的,所以我們把它放在最前面。但是技術(shù)有一個問題,它是天然擴散的。因為互聯(lián)網(wǎng)的本質(zhì)就是分享和傳播,Google在地球的另一端發(fā)布一個新的技術(shù),用不了幾天的時間,我們中國的各位選手就能馬上利用起來,來結(jié)合到我們現(xiàn)在的技術(shù)里面。特別是在深度學(xué)習(xí)時代,技術(shù)已經(jīng)很難成為公司之間的競爭壁壘。所以,在技術(shù)領(lǐng)域,我們要做到走在前面,跟住時代的步伐并且希望能夠一起參與進來,推動技術(shù)的本質(zhì)進步。但在AI時代,想要依靠技術(shù)形成壁壘和壟斷我覺得已經(jīng)不太現(xiàn)實了。

在這里我特別想引用黃仁勛先生的一段話:“如果我們看晶體管的代進性能遞增確實速度是在放緩的,如果我們的創(chuàng)新只是依賴于芯片性能一代一代提升,這個速度也一定是會放緩的。但是,如果從系統(tǒng)、算法、設(shè)計、架構(gòu)等不同的方面去看性能的提升,我們還是可以有很大的機會的。比較我們這一代的GPU架構(gòu)Pascal和上一代的GPU,性能在兩年之內(nèi)已經(jīng)有了十倍的提升,在4年時間有了65倍的提升。所以,我覺得現(xiàn)在可能已經(jīng)進入了一個叫超級摩爾定律的時代了。”

我非常認同黃仁勛先生的觀點,計算力一直在穩(wěn)步提升,甚至在加速提升。今天你引以為傲的計算力,可能沒多久就變成了大街貨,人人都可以擁有,所有參與到這方面的人都會享受到計算力提升帶來的紅利,只要你有足夠的投入。

所以說,技術(shù)是擴散的,計算力是指數(shù)性增長的。在當(dāng)下時代,只有產(chǎn)品加數(shù)據(jù)才是你的私有財產(chǎn),才能形成競爭的壁壘。

我們來看幾個例子,2005年,google的機器翻譯使用超過學(xué)術(shù)界一萬倍的數(shù)據(jù),一舉成名,搞定了翻譯界多年都搞不定的翻譯的準確率難題。Google 2009年收購的reCAPTCHA,這個東西是通過一個巧妙的產(chǎn)品設(shè)計,讓用戶在網(wǎng)頁登錄輸入驗證碼的同時,為OCR訓(xùn)練提供了大量的訓(xùn)練樣本,解決了疑難字的識別問題。在AI時代之前,不管是商品的推薦還是電影的推薦,都是基于item之間的相似性來實現(xiàn)的。但自從有了大量用戶產(chǎn)品,并且用戶在這些產(chǎn)品里產(chǎn)生了足夠多的數(shù)據(jù)后,廠商們現(xiàn)在都是利用用戶行為建立推薦模型,商品的推薦進入了協(xié)同過濾時代。這是一個非常典型的通過產(chǎn)品上的數(shù)據(jù)積累改變了行業(yè)玩法的例子。

所以可以看出,要想做好AI,產(chǎn)品和數(shù)據(jù)才是重中之重。在產(chǎn)品和數(shù)據(jù)方面,要形成閉環(huán),盡早讓一個功能上線到產(chǎn)品中去累積數(shù)據(jù),進而不停去推動技術(shù)的進步。

我想再用搜狗舉一個真實的例子。搜狗目前語音識別能力和翻譯能力是非常出色的。在我們項目初期冷啟動階段,我們其實利用Google的語音識別API,做出了搜狗輸入法的語音輸入功能,并且投放上線。隨著用戶使用該功能的頻次逐漸增加,我們很快就積攢了一批原始數(shù)據(jù),然后就開始了自己的建模和訓(xùn)練工作,在很短的時間內(nèi)就用自己的模型取代了Google API,完成了自主化。在接下來很短的時間內(nèi),隨著原始語料的不斷積累,技術(shù)模型的不斷演化,線上語音識別的正確率提升特別迅速。

目前,從技術(shù)方法本身上,搜狗沒有獨特的地方,訓(xùn)練平臺我們有超過1000塊GPU的體量,據(jù)我了解百度大概有2000塊GPU的體量,但我們的優(yōu)勢是什么呢?就是線上量大。我們擁有優(yōu)秀的產(chǎn)品,給我們帶來了大量優(yōu)質(zhì)的數(shù)據(jù)?,F(xiàn)在搜狗輸入法每天語音輸入請求能達到2.5億次PV,每天產(chǎn)生20萬小時的語料,在這20萬小時的語料中,還包含著全國各個地區(qū)用戶的語料數(shù)據(jù)。

剛才提到的只是數(shù)據(jù)積累的部分,其實你結(jié)合用戶產(chǎn)品,我們完全可以做得更多,比如說去年搜狗輸入法上線了語音修改功能:當(dāng)你說錯了一句話時,以前你要用手自己在屏幕上定位,然后刪除,輸入新的字,現(xiàn)在你就完全可以跟用語音修改功能說把什么字改成什么字,再哪哪加一個標點這個功能。最初我們用輸入法用戶的行為形成了一萬條修改的文法,這個語音糾錯功能剛上線的時候,修改的成功率僅僅只有40%,但是你可以通過不斷的迭代和數(shù)據(jù)反饋,所以我們僅僅用了一個月的時間就把成功率提升到了80%。可以看出:通過好的用戶產(chǎn)品形態(tài)和數(shù)據(jù),我們就可以讓產(chǎn)品本身表現(xiàn)的更智能,映射到自然交互上它就順理成章地變得更好了。

剛才我們提到了技術(shù)是擴散的,計算力是增長的,唯有產(chǎn)品和數(shù)據(jù)可形成壁壘,絕不是說技術(shù)是不重要的,產(chǎn)品和技術(shù)之間其實也是有非常大的關(guān)系的,因為新的技術(shù)一定可以給你帶來新的產(chǎn)品形態(tài),同時好的產(chǎn)品形態(tài)一定會加速技術(shù)的進步,這兩個東西一定是相輔相成,一起往前推動了整個行業(yè)往前進步。

智能機器人的思考能力

思考能力是一個很寬泛的定義,到底做到了什么樣的程度才算有了思考能力?是滿足了加減乘除?還是滿足了一定的功能響應(yīng)或圖靈測試?到現(xiàn)在也是沒有確定的范圍。在這里我就想提出個人的一些看法,在我來看,在當(dāng)下如果一個機器人有了問答能力,就可以算是有了思考能力,就可以被稱為智能機器人了

當(dāng)然問答能力本身還是一種比較寬泛的說法,這里我把問答分成三類:

在以上三個問答的分類中,我認為這種答案建議的需求是目前來看是最高頻的,也是實現(xiàn)起來難度最大的。

為什么說答案建議是最高頻的呢?理由就是人類是有強烈的求知欲的,我們不管是在學(xué)習(xí),工作,生活,還是娛樂,其實都需要不停地獲取信息。學(xué)習(xí)中你需要查資料,生活中你買東西要知道價格,工作中你要知道各種技能,娛樂方面你要想找一些內(nèi)容,找一些花邊新聞,找電影看,找歌聽,人類求知欲的旺盛,也是互聯(lián)網(wǎng)這么多年如此蓬勃發(fā)展的一個重要原因。

人工智能與搜索引擎

說到這里,大家就可以停下來想一想,在我們現(xiàn)在人工智能時代到來之前,互聯(lián)網(wǎng)時代中我們最需要、使用頻率最高的東西是什么?我認為很多人的答案應(yīng)該是搜索引擎。為什么搜索引擎很重要?就是因為它滿足了人類的求知欲。那么同樣都是要滿足了人類的求知欲,搜索引擎和智能問答機器人之間的關(guān)系到底是什么呢?我們不妨花點時間來回顧一下搜索引擎發(fā)展的歷史:

這時候所有的搜索行為都發(fā)生在個人電腦上,可能是家里放著的一臺連著貓的PC,也可能是辦公室里面的一臺筆記本電腦。用戶在使用搜索引擎的時候輸入的是關(guān)鍵字,其實本來大家用來交流的語言都是自然語言,但是由于那個時代技術(shù)的限制,大家用著就會發(fā)現(xiàn),問搜索引擎一個完整的問題往往得不到想要的答案,反而把問句里面的關(guān)鍵字人工的提取出來,就能得到更好的結(jié)果,這實際上是人對機器的一種妥協(xié)。就像我之前談到的自然交互一樣,使用關(guān)鍵字來表達我的想法,這種交互方式它不自然。

同時在PC時代,所有信息的載體是網(wǎng)頁,萬億級別的網(wǎng)頁承載著互聯(lián)網(wǎng)上整個世界的信息,并且這些信息基本都是公開的,誰都能看見。那么在那個時代的搜索引擎的主要挑戰(zhàn)有哪些呢?

第一個是全??纯凑l能索引更多的網(wǎng)頁信息,因為有萬億級的網(wǎng)頁不是隨便一個做搜索引擎的公司都能把所有網(wǎng)頁都能索引下來的。

第二個是準。怎么樣在這么多個網(wǎng)頁中把最有價值的信息提取出來,展現(xiàn)給用戶?Google的崛起也就是因為它發(fā)明了page rank算法,變得特別準,才變成搜索引擎的王者。

第三個是便捷。我怎么統(tǒng)一入口,在第一頁的展現(xiàn)里把各種不同的信息都能很好的展現(xiàn)給用戶?到了PC時代的后期,搜索引擎除了文本之外,還能提供富媒體的內(nèi)容,再往后就有了開放平臺,直接接入各種服務(wù)商,提供垂直服務(wù)內(nèi)容。比如說天氣這種東西,都能在搜索引擎首頁上直接展現(xiàn)結(jié)果。

從PC到移動發(fā)生了很大的變化,我們還是從設(shè)備、輸入和載體這三個維度來看。

首先設(shè)備上變化就很大,大家除了工作時用電腦,平常時間走路的時候休息的時候通勤的時候也會用手機,用pad等等,使用這些智能設(shè)備的時間變得更高頻,時間更碎片化。

輸入方面,除了pc時代的關(guān)鍵字,通過手機等智能設(shè)備,我們就可以輸入語音,輸入圖像,而且這里面每一次的輸入里都蘊含著POI的信息。

信息的載體方面,除了公開的網(wǎng)頁之外,你會發(fā)現(xiàn)在各個垂直領(lǐng)域出現(xiàn)了大量優(yōu)秀的APP,每個APP在它所在的垂直領(lǐng)域都非常好的解決了用戶在這里面的需求。這些APP里包含著大量的信息,但它不像網(wǎng)頁是完全公開的,它在app里面是私有信息。

這個時代的搜索引擎在做什么呢?其實大家很容易發(fā)現(xiàn),這個時代各個商業(yè)巨頭在做連接,試圖讓搜索和APP結(jié)合起來。比方說Google推出了Deep Links,iOS底有Spotlight,deep links和universal links。還有一些戰(zhàn)略上的合作,比方說搜索和社交的結(jié)合。Bing它收購了facebook 1.8%的股份,為的就是能讓Bing在網(wǎng)頁上展現(xiàn)出你的facebook好友對一條搜索結(jié)果的評論。Google和facebook之間的合作,facebook允許google索引部分內(nèi)容,就是為了讓google把用戶引流到facebook APP里面來。再比方搜狗和騰訊之間良好的合作,使得搜狗可以直接連接微信里的優(yōu)質(zhì)內(nèi)容,推出了獨家的這種微信搜索功能,在搜索引擎中直接可以直接搜索微信公眾號的內(nèi)容。

同時值得一提的是什么呢?在移動時代,搜索的輸出形態(tài)也發(fā)生了變化,現(xiàn)在的一部分搜索結(jié)果可以直接以語音播報的形式反饋給用戶,在這個交互形態(tài)上也會變得更自然了。

很多人把2016年定義為人工智能元年。那么在人工智能時代又發(fā)生了什么變化呢?從設(shè)備上來看,輸入設(shè)備變得更加多元化,不僅僅是手機,pad,任何可以聯(lián)網(wǎng)或以接入的設(shè)備都可以,比如眼鏡,車載系統(tǒng),音箱,機器人。大家現(xiàn)在講IoT,這些東西都是T,things。當(dāng)面臨這些東西時,很多場景是不允許你輸入關(guān)鍵字的,用戶的輸入就必須是自然語言了, 伴隨著自然語言輸入,還有一些周圍的環(huán)境信息,所以整個輸入維度會更多,更加立體化。在載體方面,之前的載體是網(wǎng)頁,是APP,在現(xiàn)在智能時代,我們不缺信息,信息是爆炸的,我們?nèi)鄙俚钠鋵嵤浅审w系的結(jié)構(gòu)化的知識,所以我們在這個時代會強調(diào)知識計算。

那么大家仔細體會這三個階段,你會發(fā)現(xiàn),在滿足人類求知欲的這條路上,問答就是在AI時代搜索的最終形態(tài)。輸入從關(guān)鍵字變成了一個完整問句,方式從鍵盤變成了語音,反饋從一堆網(wǎng)頁鏈接變成了一個直接的答案,但是它的職責(zé)永遠是不變的,就是要滿足人類的這個求知欲。

我粗淺的認為,在人工智能時代,如果想做好問答機器人,那么沒有搜索的這個積累和底蘊其實是很難實現(xiàn)的,這也是為什么現(xiàn)在搜狗正在做問答的原因之一。

在中文的知識類問答里面,汪仔機器人其實已經(jīng)完全超越人類了。從2011年IBM的Watson在危險邊緣中首次擊敗人類,到2016年AlphaGo戰(zhàn)勝李世石,當(dāng)然圍棋是一個固定規(guī)則下的完全信息博弈問題,再到現(xiàn)在汪仔在中文自然語言理解、搜索、推理方面戰(zhàn)勝人類,每次新的超越所用的時間越來越短,我相信這也是人工智能時代的特色之一吧。

汪仔與Watson的區(qū)別

我們在推出汪仔之后,總會有人會提到汪仔不就是個Watson么,這個說法,所以我想在這里花一點時間來對比一下,汪仔和Watson,來看看人工智能時代的問答機器人和Watson相比到底有什么區(qū)別:

所以可以看出來,相比起Watson,汪仔是一個人工智能時代是各種優(yōu)秀技術(shù)結(jié)合起來的智能問答機器人。

結(jié)合上述內(nèi)容,這就是我對智能機器人的兩大要素的理解,第一是自然交互,第二是問答能力。可能有很多人會有不同理解,甚至意見和我完全是相悖的,我覺得是好事,因為現(xiàn)在這個時代正是一個思想綻放,百花齊放的AI時代。

到底什么是AI?

在AlphaGo出現(xiàn)之后,大家都在喊AI,就好像之前大家喊連接,喊“互聯(lián)網(wǎng)+”,喊大數(shù)據(jù)一樣。但是不管是連接、互聯(lián)網(wǎng)、大數(shù)據(jù),都沒有任何一個東西像AI一樣讓我思考這么久。我一直在想,到底什么是AI?它到底有沒有一個標準的定義?

于是之前我就花了不少精力去搜索了解,去看書,看各種文章paper,我發(fā)現(xiàn)并沒有一家權(quán)威機構(gòu)對什么是AI做出明確的定義。然后我去和各種在AI領(lǐng)域工作的人聊天,我會問他們"你在搞什么?",他們會回答我"我在搞點和人工智能有關(guān)的事情",那我繼續(xù)問"那你覺得什么是人工智能",得到的答案就千奇百怪了,甚至很多人都沒法用簡單幾句話給我描述清楚他心中的AI是什么樣子。

各位不妨在心里問問自己這個問題,能不能用簡單幾句話說清楚什么是AI?

后來我又看一篇Stanford的一篇報告,對里面的一些觀點非常認同,在這里分享給大家。報告里提到:這個世界的確對AI缺少一個精準的,統(tǒng)一的定義,但是就是因為缺少這么一個精準統(tǒng)一的定義,反而讓AI在各個不同的領(lǐng)域大放光芒,開花結(jié)果。各方參與者、研究者,可能都在對AI有一個朦朧的認識的情況下,就開始搞AI了,所以說AI沒有一個準確的定義,它未必是一件壞事情。

大家想在很多年前,在計算器剛被發(fā)明出來的時候,我相信那個年代的人一定會認為計算器是"智能"的,但是按照我們當(dāng)今這個時代的標準來看,計算器頂多算是一個小孩子的玩具罷了,和我們所提的AI相去甚遠。但你又不得不承認在當(dāng)時那個年代,計算器就是智能的。所以你仔細體會一下發(fā)展的過程,AI是不是能算做一種努力?

AI是一種不停的努力,試圖讓機器變得更智能。更有意思的是什么呢?AI這種努力會推進我們向更先進更智能的領(lǐng)域前進,但是你一旦進入到這個領(lǐng)域之后,我們就會想方設(shè)法把AI從這個領(lǐng)域里剔除出去。大家想想看,因為AI,我們把一個全新的科技帶入到一個common field里面來,然后等人類熟悉這個東西之后,就不再覺得這個東西是個AI了,不覺得它智能了,然后又會有更新的科技誕生。所以你從這方面來看AI也能算做一種趨勢,它永遠去追求更遠的進步。

就拿現(xiàn)在的下棋AI舉例子,當(dāng)年深藍在初次戰(zhàn)勝卡斯帕羅夫的時候,我還是一個小孩,我守在家里小小的電視前面看新聞,我就覺得電腦好神奇,簡直太智能了,完全打破了我對計算機能做到的事情的理解。但現(xiàn)在你隨便對一個AI行業(yè)里的人去說,說只會下國際象棋的深藍是AI的話,估計你會被嘲笑吧。但是現(xiàn)在大家又全部都同意說AlphaGo現(xiàn)在就是AI的代表作之一,那么十年二十年之后,AlphaGo會不會陷入到現(xiàn)在深藍的境地,誰又知道呢?但我相信,不管在那個年代AlphaGo是怎么樣的,AI還一定還在人類心中。

鈦坦白群友互動:

1、請問,使用人工智能做內(nèi)容推薦,如何解決推薦的內(nèi)容會限制用戶視野的問題?

武健:其實推薦的便捷和限制用戶視野的問題,的確是長久以來推薦體系面臨的問題,也是整個推薦系統(tǒng)大家一直致力于解決的一個問題。我覺得要從兩個層面來解決這個問題:

2、請問什么產(chǎn)品能更好承載了語音視覺交互的問答,耳機還是眼鏡?

武?。哼@個東西我比較關(guān)注的兩個,一個是說問答機器人,剛才我詳細的已經(jīng)解說過了。還有一個是翻譯機,你會發(fā)現(xiàn)現(xiàn)在的熱點就是翻譯,翻譯機的形態(tài)有很多。它可能是一個耳機,也可能是一個手持設(shè)備。但是現(xiàn)在有很多的人都在集中力量來做這個事情,想實現(xiàn)多語言之間的這種互通,來方便出國旅游或者會議這種翻譯場景的使用,像現(xiàn)在科大訊飛已經(jīng)推出了2B的產(chǎn)品。

很好的實現(xiàn)了語音交互的系統(tǒng),還有什么呢?就是車載系統(tǒng),剛才也提到了,比如現(xiàn)在的車載導(dǎo)航,我們正在致力于開發(fā)。首先它一定是在一個垂直領(lǐng)域里面,然后它是基于多人對話的一種智能語音系統(tǒng),你可以說:“我要去機場”,它問你哪個航站樓,你說:“我要去T3”,或者直接告訴他航班號。在路途中間,如果你說:“我想去喝杯咖啡”,他會幫你計算在你去機場的路上哪兒有星巴克。它就是以很好的產(chǎn)品形態(tài)承載了語音視覺的交互,同時它還伴隨著后面有個知識體系。

3、請問您認為在知識推薦領(lǐng)域,何時能夠做到精準并民用?

武健:這個問題我還是想結(jié)合搜索來回答。因為現(xiàn)在我們可以說搜索引擎已經(jīng)是解決了這個問題,但是形態(tài)上跟推薦不太一樣。因為搜索上它給出的答案是十條,推薦上面它可能給你一個精準的答案。但是就像我之前說的,做這種精準的推薦一定是要基于搜索來做的,它往后更多的發(fā)展可能是你的產(chǎn)品形態(tài)上的變化,一定要有一個非常好的產(chǎn)品形態(tài),然后才能讓它去進入精準的民用級。以我個人粗淺的理解,我覺得兩三年的時間吧。兩三年之內(nèi),這種精準的民用級知識推薦,不能說在全領(lǐng)域,但是一定是在一些特定的垂直領(lǐng)域,我覺得就能實現(xiàn)得很好了,我不知道這樣回答是否你想要的答案。

4、請問剛才提到的就是說現(xiàn)在的這種人工干預(yù)還多嗎?

武健:其實現(xiàn)在的人工干預(yù)還是非常多的?,F(xiàn)在不管是在語音識別,在語義理解還是需要大量人工標注的,就是你數(shù)據(jù)的積累是一部分。但是你前期的提升靠大量的數(shù)據(jù)來灌其實效果是很好的,到后面你想一個點一個點提升的時候,還是需要有大量的人工標注的?,F(xiàn)在但凡在模式識別這個問題里面,我們還沒有說能夠脫離人工標注來進行完美實現(xiàn)的一個方案,所以說現(xiàn)在有些人就會戲稱所謂人工智能其實還是工人智能。

(本文獨家首發(fā)鈦媒體,根據(jù)搜狗基礎(chǔ)平臺負責(zé)人、機器人負責(zé)人武健在鈦坦白上的分享整理)

…………………………………………

本文系作者 葛佳音 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

10:14

廣東省市場監(jiān)管局聯(lián)合廣州市市場監(jiān)管局召開平臺企業(yè)座談會

10:10

貝殼啟動戰(zhàn)略變革:管理者站上一線,經(jīng)紀人KPI減負

10:06

中東戰(zhàn)事致燃油短缺,越南多家航司將削減航班數(shù)量

10:06

新研究估計全球每年逾25萬人死于腦膜炎

10:02

印尼16歲以下人群“社媒禁令”正式生效

10:01

調(diào)查顯示日本市場逾2500種食品4月份將漲價

10:01

西南首個商業(yè)衛(wèi)星遙感測運控站啟用

09:25

美國全國范圍爆發(fā)反對特朗普政府集會,預(yù)計超900萬人參與,或為“美國歷史上規(guī)模最大”抗議活動

09:23

馬斯克旗下AI公司初創(chuàng)“11羅漢”全部離職

09:21

巴基斯坦稱伊朗已同意再放行20艘巴船只通過霍爾木茲海峽

09:20

法國警方挫敗美資銀行門前爆炸企圖

09:18

美軍否認其人員在迪拜遭襲

09:17

以軍稱接近完成對伊朗約90%關(guān)鍵軍工設(shè)施的打擊

09:14

委內(nèi)瑞拉恢復(fù)啟用駐美國外交機構(gòu)

09:13

伊朗稱襲擊阿聯(lián)酋巴林與美相關(guān)企業(yè)

09:11

全國民航今起執(zhí)行夏秋航季航班計劃

09:11

德國通過《2026氣候保護計劃》,多項措施推動減排

09:08

萬斯獲美共和黨保守派陣營過半支持

09:08

古巴外長指責(zé)美方就其燃料限制措施“厚顏無恥地撒謊”

09:07

智能網(wǎng)聯(lián)汽車等系列團體標準發(fā)布,加速共性關(guān)鍵技術(shù)轉(zhuǎn)化與應(yīng)用

掃描下載App