日本无码久久一区二区在线播放 ,免费码黄网站在线播放

大家好，很高興今天晚上在鈦坦白跟大家聊聊人工智能。我叫武健，畢業(yè)于清華大學(xué)。畢業(yè)之后一直在搜狗工作，從去年開始主導(dǎo)了搜狗汪仔機器人的項目，參加了“一站到底”，目前節(jié)目已經(jīng)播出了半年時間，效果很好，引起了很多人的關(guān)注。

我相信在若干年前，當(dāng)大家聊起機器人時，腦海里浮現(xiàn)出來的可能是這樣的場景：

這些機器人看著都很炫酷，也非常高級，但感覺離我們的真實生活是非常遠的。今天，如果我再跟大家說機器人，大家可能想到的就是這樣的場景了：

誠然，工業(yè)機器人還在它所在的領(lǐng)域發(fā)揮著巨大的作用，這點是毋庸置疑的，但是人們的注意力已經(jīng)轉(zhuǎn)移到各種聊天機器人、陪伴機器人、服務(wù)機器人以及教育機器人上面了。

對于機器人的定義與理解

在科技界，科學(xué)家會給每個科技屬一個明確的定義。機器人問世已經(jīng)有幾十年了，但是對于它的定義仍然仁者見仁智者見智，沒有統(tǒng)一的意見，原因之一是機器人還在發(fā)展，新的機型和功能不斷的涌現(xiàn)出來。

但我覺得根本原因，是“機器人”涉及到了“人”的概念，成為一了個很難回答的哲學(xué)問題。機器人這個詞，最早誕生于科幻小說之中，人們對機器人充滿了幻想。也許正是因為對機器人定義的模糊，才給了人們充分的想象和創(chuàng)造空間。

不管怎么樣，我姑且先把之前提到的這幾種機器人統(tǒng)稱為智能機器人，即人工智能機器人?？赡苡腥藭氲降资裁词侨斯ぶ悄苣兀课蚁仍谶@里賣個關(guān)子，咱們最后再來討論這個問題。

智能機器人跟我們之前提到的這種工業(yè)機器人有什么區(qū)別呢？在我來看，最重要的一點是智能機器人是擁有非常發(fā)達的大腦的。

那么我們可以接著往下繼續(xù)深入的思考一下，到底擁有什么樣的能力才算擁有了大腦？因為不同的人對于大腦的理解也是不一樣的，我提一些個人的想法。

人工智能機器人的關(guān)鍵能力

如果讓我來定義的話，我覺得人工智能機器人至少要擁有兩個關(guān)鍵的能力：

基于剛才我提到的這兩點，一個是交互能力，一個是思考的能力，來重新思考這個機器人的定義，那么滿足這兩個條件恐怕就不僅僅限于我剛才照片里發(fā)的那些擁有真實物理形態(tài)的機器人了。

所以在我看來，智能機器人重要的不是是否擁有運動能力，能舉起多重的東西，是否能跳起來，而是看這個東西在跟誰打交道，怎么打交道。如果一個不是人類的東西能夠跟人類正常的交往，那么我其實就很愿意叫它為機器人。當(dāng)然我想在這里強調(diào)一下我并沒有提起是否要滿足圖靈測試這一點，我個人認為在現(xiàn)階段要滿足圖靈測試還是一個夢想，拿圖靈測試來做一個東西的評判標準還是不太合適的，所以說我們可以把這個標準放低一點，來看這個事情。

智能機器人的交互能力

我剛才提到了智能機器人的重點是要跟人類打交道，那么跟人類打交道里面最重要的是什么呢？大家來看機器人這個詞，把它拆開是機器+人來組成的，機器二字突出的是什么呢？突出它的確是一個非人類，是一個物體。但是人字又體現(xiàn)出我們其實希望它是個人，更準確的說它像個人。那么你在跟一個東西進行交流時，它怎么樣才能像個人呢？

其實最基本的一點就是機器在跟人打交道時它要表現(xiàn)得很自然，我們把這種交互方式叫自然交互。怎么樣的交互才叫自然的呢？是說這個學(xué)習(xí)成本越低越好，這個交互越接近人類的本能越好，還是說我們要從信息的輸入和獲取的方式上來判斷呢？

我們回過頭來看過去幾十年計算機的發(fā)展以及人和機器交互方式的演化，從純文字的命令行窗口，到有圖形的視窗+鼠標控制輸入，再到后來的視窗+接屏控釋，我們不難發(fā)現(xiàn)，其實人和機器之間的交流的學(xué)習(xí)成本在不斷的降低，人機交互變得越來越接近人的自然能力。

今天，語音其實正在成為一個最自然的交互方式。馬麗米克在2016年的互聯(lián)網(wǎng)趨勢報告就提到了："語音應(yīng)當(dāng)是最有效的輸入計算形式，在2015年，美國使用過語音助手的用戶比例已經(jīng)達到65%。在這些使用語音的用戶中有43%的人是在家中使用。"隨著技術(shù)的進步和語音效果的提升，這兩年比例還在持續(xù)的擴大中。我相信在座一定都用過語音輸入這個方式。

人們使用語音的場景有很多，比方說開車時候你的雙手雙眼都被占用了，在客廳里面，有些設(shè)備可能就沒有傳統(tǒng)的這種鍵盤輸入，在戶外行走的時候打字很慢等等。說到這里，我必須暫停一下，向偉大的蘋果公司致敬，剛才我們提到的每一個新的交互形態(tài)，都是由蘋果在工業(yè)界點燃的。通過自然語言來進行知識信息獲取和服務(wù)的，蘋果可能不是第一家，但它一定是開啟時代的那一家。當(dāng)然互聯(lián)網(wǎng)上有很多關(guān)于"為什么只有蘋果才能做出如此創(chuàng)新"的文章，數(shù)不勝數(shù)，大家都有自己的理解，我們這里就不再深入去聊了。

如何做好自然交互？

對于這種開放式的問題其實并沒有唯一的答案，我也只是結(jié)合搜狗在做的事情談一些心得和體會。

在我看來，自然交互的本質(zhì)其實就是人工智能，而有價值的人工智能 = 技術(shù) + 計算力 + 數(shù)據(jù) + 產(chǎn)品。所以，自然交互= 技術(shù) + 計算力 + 數(shù)據(jù) + 產(chǎn)品。這里的有價值的人工智能，指的是能夠以真實的產(chǎn)品形態(tài)滿足用戶需求的，而決不是停留在實驗室里面的那些原型。

在我剛才提到的模型里面，技術(shù)是很重要的，所以我們把它放在最前面。但是技術(shù)有一個問題，它是天然擴散的。因為互聯(lián)網(wǎng)的本質(zhì)就是分享和傳播，Google在地球的另一端發(fā)布一個新的技術(shù)，用不了幾天的時間，我們中國的各位選手就能馬上利用起來，來結(jié)合到我們現(xiàn)在的技術(shù)里面。特別是在深度學(xué)習(xí)時代，技術(shù)已經(jīng)很難成為公司之間的競爭壁壘。所以，在技術(shù)領(lǐng)域，我們要做到走在前面，跟住時代的步伐并且希望能夠一起參與進來，推動技術(shù)的本質(zhì)進步。但在AI時代，想要依靠技術(shù)形成壁壘和壟斷我覺得已經(jīng)不太現(xiàn)實了。

在這里我特別想引用黃仁勛先生的一段話：“如果我們看晶體管的代進性能遞增確實速度是在放緩的，如果我們的創(chuàng)新只是依賴于芯片性能一代一代提升，這個速度也一定是會放緩的。但是，如果從系統(tǒng)、算法、設(shè)計、架構(gòu)等不同的方面去看性能的提升，我們還是可以有很大的機會的。比較我們這一代的GPU架構(gòu)Pascal和上一代的GPU，性能在兩年之內(nèi)已經(jīng)有了十倍的提升，在4年時間有了65倍的提升。所以，我覺得現(xiàn)在可能已經(jīng)進入了一個叫超級摩爾定律的時代了。”

我非常認同黃仁勛先生的觀點，計算力一直在穩(wěn)步提升，甚至在加速提升。今天你引以為傲的計算力，可能沒多久就變成了大街貨，人人都可以擁有，所有參與到這方面的人都會享受到計算力提升帶來的紅利，只要你有足夠的投入。

所以說，技術(shù)是擴散的，計算力是指數(shù)性增長的。在當(dāng)下時代，只有產(chǎn)品加數(shù)據(jù)才是你的私有財產(chǎn)，才能形成競爭的壁壘。

我們來看幾個例子，2005年，google的機器翻譯使用超過學(xué)術(shù)界一萬倍的數(shù)據(jù)，一舉成名，搞定了翻譯界多年都搞不定的翻譯的準確率難題。Google 2009年收購的reCAPTCHA，這個東西是通過一個巧妙的產(chǎn)品設(shè)計，讓用戶在網(wǎng)頁登錄輸入驗證碼的同時，為OCR訓(xùn)練提供了大量的訓(xùn)練樣本，解決了疑難字的識別問題。在AI時代之前，不管是商品的推薦還是電影的推薦，都是基于item之間的相似性來實現(xiàn)的。但自從有了大量用戶產(chǎn)品，并且用戶在這些產(chǎn)品里產(chǎn)生了足夠多的數(shù)據(jù)后，廠商們現(xiàn)在都是利用用戶行為建立推薦模型，商品的推薦進入了協(xié)同過濾時代。這是一個非常典型的通過產(chǎn)品上的數(shù)據(jù)積累改變了行業(yè)玩法的例子。

所以可以看出，要想做好AI，產(chǎn)品和數(shù)據(jù)才是重中之重。在產(chǎn)品和數(shù)據(jù)方面，要形成閉環(huán)，盡早讓一個功能上線到產(chǎn)品中去累積數(shù)據(jù)，進而不停去推動技術(shù)的進步。

我想再用搜狗舉一個真實的例子。搜狗目前語音識別能力和翻譯能力是非常出色的。在我們項目初期冷啟動階段，我們其實利用Google的語音識別API，做出了搜狗輸入法的語音輸入功能，并且投放上線。隨著用戶使用該功能的頻次逐漸增加，我們很快就積攢了一批原始數(shù)據(jù)，然后就開始了自己的建模和訓(xùn)練工作，在很短的時間內(nèi)就用自己的模型取代了Google API，完成了自主化。在接下來很短的時間內(nèi)，隨著原始語料的不斷積累，技術(shù)模型的不斷演化，線上語音識別的正確率提升特別迅速。

目前，從技術(shù)方法本身上，搜狗沒有獨特的地方，訓(xùn)練平臺我們有超過1000塊GPU的體量，據(jù)我了解百度大概有2000塊GPU的體量，但我們的優(yōu)勢是什么呢？就是線上量大。我們擁有優(yōu)秀的產(chǎn)品，給我們帶來了大量優(yōu)質(zhì)的數(shù)據(jù)?，F(xiàn)在搜狗輸入法每天語音輸入請求能達到2.5億次PV，每天產(chǎn)生20萬小時的語料，在這20萬小時的語料中，還包含著全國各個地區(qū)用戶的語料數(shù)據(jù)。

剛才提到的只是數(shù)據(jù)積累的部分，其實你結(jié)合用戶產(chǎn)品，我們完全可以做得更多，比如說去年搜狗輸入法上線了語音修改功能：當(dāng)你說錯了一句話時，以前你要用手自己在屏幕上定位，然后刪除，輸入新的字，現(xiàn)在你就完全可以跟用語音修改功能說把什么字改成什么字，再哪哪加一個標點這個功能。最初我們用輸入法用戶的行為形成了一萬條修改的文法，這個語音糾錯功能剛上線的時候，修改的成功率僅僅只有40%，但是你可以通過不斷的迭代和數(shù)據(jù)反饋，所以我們僅僅用了一個月的時間就把成功率提升到了80%。可以看出：通過好的用戶產(chǎn)品形態(tài)和數(shù)據(jù)，我們就可以讓產(chǎn)品本身表現(xiàn)的更智能，映射到自然交互上它就順理成章地變得更好了。

剛才我們提到了技術(shù)是擴散的，計算力是增長的，唯有產(chǎn)品和數(shù)據(jù)可形成壁壘，絕不是說技術(shù)是不重要的，產(chǎn)品和技術(shù)之間其實也是有非常大的關(guān)系的，因為新的技術(shù)一定可以給你帶來新的產(chǎn)品形態(tài)，同時好的產(chǎn)品形態(tài)一定會加速技術(shù)的進步，這兩個東西一定是相輔相成，一起往前推動了整個行業(yè)往前進步。

智能機器人的思考能力

思考能力是一個很寬泛的定義，到底做到了什么樣的程度才算有了思考能力？是滿足了加減乘除？還是滿足了一定的功能響應(yīng)或圖靈測試？到現(xiàn)在也是沒有確定的范圍。在這里我就想提出個人的一些看法，在我來看，在當(dāng)下如果一個機器人有了問答能力，就可以算是有了思考能力，就可以被稱為智能機器人了。

當(dāng)然問答能力本身還是一種比較寬泛的說法，這里我把問答分成三類：

在以上三個問答的分類中，我認為這種答案建議的需求是目前來看是最高頻的，也是實現(xiàn)起來難度最大的。

為什么說答案建議是最高頻的呢？理由就是人類是有強烈的求知欲的，我們不管是在學(xué)習(xí)，工作，生活，還是娛樂，其實都需要不停地獲取信息。學(xué)習(xí)中你需要查資料，生活中你買東西要知道價格，工作中你要知道各種技能，娛樂方面你要想找一些內(nèi)容，找一些花邊新聞，找電影看，找歌聽，人類求知欲的旺盛，也是互聯(lián)網(wǎng)這么多年如此蓬勃發(fā)展的一個重要原因。

人工智能與搜索引擎

說到這里，大家就可以停下來想一想，在我們現(xiàn)在人工智能時代到來之前，互聯(lián)網(wǎng)時代中我們最需要、使用頻率最高的東西是什么？我認為很多人的答案應(yīng)該是搜索引擎。為什么搜索引擎很重要？就是因為它滿足了人類的求知欲。那么同樣都是要滿足了人類的求知欲，搜索引擎和智能問答機器人之間的關(guān)系到底是什么呢？我們不妨花點時間來回顧一下搜索引擎發(fā)展的歷史：

這時候所有的搜索行為都發(fā)生在個人電腦上，可能是家里放著的一臺連著貓的PC，也可能是辦公室里面的一臺筆記本電腦。用戶在使用搜索引擎的時候輸入的是關(guān)鍵字，其實本來大家用來交流的語言都是自然語言，但是由于那個時代技術(shù)的限制，大家用著就會發(fā)現(xiàn)，問搜索引擎一個完整的問題往往得不到想要的答案，反而把問句里面的關(guān)鍵字人工的提取出來，就能得到更好的結(jié)果，這實際上是人對機器的一種妥協(xié)。就像我之前談到的自然交互一樣，使用關(guān)鍵字來表達我的想法，這種交互方式它不自然。

同時在PC時代，所有信息的載體是網(wǎng)頁，萬億級別的網(wǎng)頁承載著互聯(lián)網(wǎng)上整個世界的信息，并且這些信息基本都是公開的，誰都能看見。那么在那個時代的搜索引擎的主要挑戰(zhàn)有哪些呢？

第一個是全?？纯凑l能索引更多的網(wǎng)頁信息，因為有萬億級的網(wǎng)頁不是隨便一個做搜索引擎的公司都能把所有網(wǎng)頁都能索引下來的。

第二個是準。怎么樣在這么多個網(wǎng)頁中把最有價值的信息提取出來，展現(xiàn)給用戶？Google的崛起也就是因為它發(fā)明了page rank算法，變得特別準，才變成搜索引擎的王者。

第三個是便捷。我怎么統(tǒng)一入口，在第一頁的展現(xiàn)里把各種不同的信息都能很好的展現(xiàn)給用戶？到了PC時代的后期，搜索引擎除了文本之外，還能提供富媒體的內(nèi)容，再往后就有了開放平臺，直接接入各種服務(wù)商，提供垂直服務(wù)內(nèi)容。比如說天氣這種東西，都能在搜索引擎首頁上直接展現(xiàn)結(jié)果。

從PC到移動發(fā)生了很大的變化，我們還是從設(shè)備、輸入和載體這三個維度來看。

首先設(shè)備上變化就很大，大家除了工作時用電腦，平常時間走路的時候休息的時候通勤的時候也會用手機，用pad等等，使用這些智能設(shè)備的時間變得更高頻，時間更碎片化。

輸入方面，除了pc時代的關(guān)鍵字，通過手機等智能設(shè)備，我們就可以輸入語音，輸入圖像，而且這里面每一次的輸入里都蘊含著POI的信息。

信息的載體方面，除了公開的網(wǎng)頁之外，你會發(fā)現(xiàn)在各個垂直領(lǐng)域出現(xiàn)了大量優(yōu)秀的APP，每個APP在它所在的垂直領(lǐng)域都非常好的解決了用戶在這里面的需求。這些APP里包含著大量的信息，但它不像網(wǎng)頁是完全公開的，它在app里面是私有信息。

這個時代的搜索引擎在做什么呢？其實大家很容易發(fā)現(xiàn)，這個時代各個商業(yè)巨頭在做連接，試圖讓搜索和APP結(jié)合起來。比方說Google推出了Deep Links，iOS底有Spotlight，deep links和universal links。還有一些戰(zhàn)略上的合作，比方說搜索和社交的結(jié)合。Bing它收購了facebook 1.8%的股份，為的就是能讓Bing在網(wǎng)頁上展現(xiàn)出你的facebook好友對一條搜索結(jié)果的評論。Google和facebook之間的合作，facebook允許google索引部分內(nèi)容，就是為了讓google把用戶引流到facebook APP里面來。再比方搜狗和騰訊之間良好的合作，使得搜狗可以直接連接微信里的優(yōu)質(zhì)內(nèi)容，推出了獨家的這種微信搜索功能，在搜索引擎中直接可以直接搜索微信公眾號的內(nèi)容。

同時值得一提的是什么呢？在移動時代，搜索的輸出形態(tài)也發(fā)生了變化，現(xiàn)在的一部分搜索結(jié)果可以直接以語音播報的形式反饋給用戶，在這個交互形態(tài)上也會變得更自然了。

很多人把2016年定義為人工智能元年。那么在人工智能時代又發(fā)生了什么變化呢？從設(shè)備上來看，輸入設(shè)備變得更加多元化，不僅僅是手機，pad，任何可以聯(lián)網(wǎng)或以接入的設(shè)備都可以，比如眼鏡，車載系統(tǒng)，音箱，機器人。大家現(xiàn)在講IoT，這些東西都是T，things。當(dāng)面臨這些東西時，很多場景是不允許你輸入關(guān)鍵字的，用戶的輸入就必須是自然語言了，伴隨著自然語言輸入，還有一些周圍的環(huán)境信息，所以整個輸入維度會更多，更加立體化。在載體方面，之前的載體是網(wǎng)頁，是APP，在現(xiàn)在智能時代，我們不缺信息，信息是爆炸的，我們?nèi)鄙俚钠鋵嵤浅审w系的結(jié)構(gòu)化的知識，所以我們在這個時代會強調(diào)知識計算。

那么大家仔細體會這三個階段，你會發(fā)現(xiàn)，在滿足人類求知欲的這條路上，問答就是在AI時代搜索的最終形態(tài)。輸入從關(guān)鍵字變成了一個完整問句，方式從鍵盤變成了語音，反饋從一堆網(wǎng)頁鏈接變成了一個直接的答案，但是它的職責(zé)永遠是不變的，就是要滿足人類的這個求知欲。

我粗淺的認為，在人工智能時代，如果想做好問答機器人，那么沒有搜索的這個積累和底蘊其實是很難實現(xiàn)的，這也是為什么現(xiàn)在搜狗正在做問答的原因之一。

在中文的知識類問答里面，汪仔機器人其實已經(jīng)完全超越人類了。從2011年IBM的Watson在危險邊緣中首次擊敗人類，到2016年AlphaGo戰(zhàn)勝李世石，當(dāng)然圍棋是一個固定規(guī)則下的完全信息博弈問題，再到現(xiàn)在汪仔在中文自然語言理解、搜索、推理方面戰(zhàn)勝人類，每次新的超越所用的時間越來越短，我相信這也是人工智能時代的特色之一吧。

汪仔與Watson的區(qū)別

我們在推出汪仔之后，總會有人會提到汪仔不就是個Watson么，這個說法，所以我想在這里花一點時間來對比一下，汪仔和Watson，來看看人工智能時代的問答機器人和Watson相比到底有什么區(qū)別：

所以可以看出來，相比起Watson，汪仔是一個人工智能時代是各種優(yōu)秀技術(shù)結(jié)合起來的智能問答機器人。

結(jié)合上述內(nèi)容，這就是我對智能機器人的兩大要素的理解，第一是自然交互，第二是問答能力。可能有很多人會有不同理解，甚至意見和我完全是相悖的，我覺得是好事，因為現(xiàn)在這個時代正是一個思想綻放，百花齊放的AI時代。

到底什么是AI？

在AlphaGo出現(xiàn)之后，大家都在喊AI，就好像之前大家喊連接，喊“互聯(lián)網(wǎng)+”，喊大數(shù)據(jù)一樣。但是不管是連接、互聯(lián)網(wǎng)、大數(shù)據(jù)，都沒有任何一個東西像AI一樣讓我思考這么久。我一直在想，到底什么是AI？它到底有沒有一個標準的定義？

于是之前我就花了不少精力去搜索了解，去看書，看各種文章paper，我發(fā)現(xiàn)并沒有一家權(quán)威機構(gòu)對什么是AI做出明確的定義。然后我去和各種在AI領(lǐng)域工作的人聊天，我會問他們"你在搞什么？"，他們會回答我"我在搞點和人工智能有關(guān)的事情"，那我繼續(xù)問"那你覺得什么是人工智能"，得到的答案就千奇百怪了，甚至很多人都沒法用簡單幾句話給我描述清楚他心中的AI是什么樣子。

各位不妨在心里問問自己這個問題，能不能用簡單幾句話說清楚什么是AI？

后來我又看一篇Stanford的一篇報告，對里面的一些觀點非常認同，在這里分享給大家。報告里提到：這個世界的確對AI缺少一個精準的，統(tǒng)一的定義，但是就是因為缺少這么一個精準統(tǒng)一的定義，反而讓AI在各個不同的領(lǐng)域大放光芒，開花結(jié)果。各方參與者、研究者，可能都在對AI有一個朦朧的認識的情況下，就開始搞AI了，所以說AI沒有一個準確的定義，它未必是一件壞事情。

大家想在很多年前，在計算器剛被發(fā)明出來的時候，我相信那個年代的人一定會認為計算器是"智能"的，但是按照我們當(dāng)今這個時代的標準來看，計算器頂多算是一個小孩子的玩具罷了，和我們所提的AI相去甚遠。但你又不得不承認在當(dāng)時那個年代，計算器就是智能的。所以你仔細體會一下發(fā)展的過程，AI是不是能算做一種努力？

AI是一種不停的努力，試圖讓機器變得更智能。更有意思的是什么呢？AI這種努力會推進我們向更先進更智能的領(lǐng)域前進，但是你一旦進入到這個領(lǐng)域之后，我們就會想方設(shè)法把AI從這個領(lǐng)域里剔除出去。大家想想看，因為AI，我們把一個全新的科技帶入到一個common field里面來，然后等人類熟悉這個東西之后，就不再覺得這個東西是個AI了，不覺得它智能了，然后又會有更新的科技誕生。所以你從這方面來看AI也能算做一種趨勢，它永遠去追求更遠的進步。

就拿現(xiàn)在的下棋AI舉例子，當(dāng)年深藍在初次戰(zhàn)勝卡斯帕羅夫的時候，我還是一個小孩，我守在家里小小的電視前面看新聞，我就覺得電腦好神奇，簡直太智能了，完全打破了我對計算機能做到的事情的理解。但現(xiàn)在你隨便對一個AI行業(yè)里的人去說，說只會下國際象棋的深藍是AI的話，估計你會被嘲笑吧。但是現(xiàn)在大家又全部都同意說AlphaGo現(xiàn)在就是AI的代表作之一，那么十年二十年之后，AlphaGo會不會陷入到現(xiàn)在深藍的境地，誰又知道呢？但我相信，不管在那個年代AlphaGo是怎么樣的，AI還一定還在人類心中。

鈦坦白群友互動：

1、請問，使用人工智能做內(nèi)容推薦，如何解決推薦的內(nèi)容會限制用戶視野的問題？

武健：其實推薦的便捷和限制用戶視野的問題，的確是長久以來推薦體系面臨的問題，也是整個推薦系統(tǒng)大家一直致力于解決的一個問題。我覺得要從兩個層面來解決這個問題：

2、請問什么產(chǎn)品能更好承載了語音視覺交互的問答，耳機還是眼鏡？

武?。哼@個東西我比較關(guān)注的兩個，一個是說問答機器人，剛才我詳細的已經(jīng)解說過了。還有一個是翻譯機，你會發(fā)現(xiàn)現(xiàn)在的熱點就是翻譯，翻譯機的形態(tài)有很多。它可能是一個耳機，也可能是一個手持設(shè)備。但是現(xiàn)在有很多的人都在集中力量來做這個事情，想實現(xiàn)多語言之間的這種互通，來方便出國旅游或者會議這種翻譯場景的使用，像現(xiàn)在科大訊飛已經(jīng)推出了2B的產(chǎn)品。

很好的實現(xiàn)了語音交互的系統(tǒng)，還有什么呢？就是車載系統(tǒng)，剛才也提到了，比如現(xiàn)在的車載導(dǎo)航，我們正在致力于開發(fā)。首先它一定是在一個垂直領(lǐng)域里面，然后它是基于多人對話的一種智能語音系統(tǒng)，你可以說：“我要去機場”，它問你哪個航站樓，你說：“我要去T3”，或者直接告訴他航班號。在路途中間，如果你說：“我想去喝杯咖啡”，他會幫你計算在你去機場的路上哪兒有星巴克。它就是以很好的產(chǎn)品形態(tài)承載了語音視覺的交互，同時它還伴隨著后面有個知識體系。

3、請問您認為在知識推薦領(lǐng)域，何時能夠做到精準并民用？

武健：這個問題我還是想結(jié)合搜索來回答。因為現(xiàn)在我們可以說搜索引擎已經(jīng)是解決了這個問題，但是形態(tài)上跟推薦不太一樣。因為搜索上它給出的答案是十條，推薦上面它可能給你一個精準的答案。但是就像我之前說的，做這種精準的推薦一定是要基于搜索來做的，它往后更多的發(fā)展可能是你的產(chǎn)品形態(tài)上的變化，一定要有一個非常好的產(chǎn)品形態(tài)，然后才能讓它去進入精準的民用級。以我個人粗淺的理解，我覺得兩三年的時間吧。兩三年之內(nèi)，這種精準的民用級知識推薦，不能說在全領(lǐng)域，但是一定是在一些特定的垂直領(lǐng)域，我覺得就能實現(xiàn)得很好了，我不知道這樣回答是否你想要的答案。

4、請問剛才提到的就是說現(xiàn)在的這種人工干預(yù)還多嗎？

武健：其實現(xiàn)在的人工干預(yù)還是非常多的?，F(xiàn)在不管是在語音識別，在語義理解還是需要大量人工標注的，就是你數(shù)據(jù)的積累是一部分。但是你前期的提升靠大量的數(shù)據(jù)來灌其實效果是很好的，到后面你想一個點一個點提升的時候，還是需要有大量的人工標注的?，F(xiàn)在但凡在模式識別這個問題里面，我們還沒有說能夠脫離人工標注來進行完美實現(xiàn)的一個方案，所以說現(xiàn)在有些人就會戲稱所謂人工智能其實還是工人智能。

（本文獨家首發(fā)鈦媒體，根據(jù)搜狗基礎(chǔ)平臺負責(zé)人、機器人負責(zé)人武健在鈦坦白上的分享整理）

快報