隨著AlphaGo挑戰(zhàn)人類成功,人工智能(AI)吸引了越來越多人的關(guān)注。人工智能離我們有多遠(yuǎn)?在9月13日舉辦的“2016新浪C+峰會”上,科大訊飛創(chuàng)始人、輪值總裁、研究院院長胡郁發(fā)表了題為《從能聽會說到能理解會思考,以語音為入口的認(rèn)知革命》的演講。胡郁認(rèn)為,在將來的10年,人工智能也會像水和電一樣進(jìn)入到我們的生活當(dāng)中,讓每個人都離不開。
胡郁演講過程中,現(xiàn)場使用了科大訊飛最新的語音轉(zhuǎn)寫產(chǎn)品“訊飛聽見”,把他的演講內(nèi)容變成文字展示在屏幕上。鈦媒體編輯注意到,胡郁在有意加快語速,1分鐘300字左右,屏幕上的字幾乎同步出現(xiàn),只有個別詞有錯誤。如果讓機(jī)器不斷學(xué)習(xí),隨著技術(shù)的進(jìn)步,也許速記這個職業(yè)真的會被替代!這對于經(jīng)常要整理錄音的記者們來說是個不錯的消息。
胡郁先回顧了人工智能的發(fā)展歷史。從概念提出至今已有60年,人工智能的發(fā)展并不是一帆風(fēng)順的。人們從對它期望過高,到失望,到再次關(guān)注,到這兩年非常熱。目前國內(nèi)外很多國家投入人力、物力進(jìn)行研究,因為大家越來越意識到,人工智能不僅關(guān)系到我們每個人的生活,還關(guān)系到國家發(fā)展。
人工智能發(fā)展、實現(xiàn)突破的關(guān)鍵點是什么呢?胡郁從人類的起源講起,認(rèn)為在七萬年前,智人滅了其他的猿人成為現(xiàn)存人類的祖先,是因為認(rèn)知革命使其在語言和智能上實現(xiàn)突破。而人工智能應(yīng)該分為計算智能、感知智能和認(rèn)知智能,其中認(rèn)知智能是機(jī)器智能戰(zhàn)勝人類的非常重要的節(jié)點,它們現(xiàn)在還有很大的差距。
而實現(xiàn)人工智能突破的思路也分為兩種:一種是通過對人類大腦的了解,從腦神經(jīng)學(xué)習(xí)的機(jī)理、機(jī)制、結(jié)構(gòu)等出發(fā),設(shè)計更好的算法;另一種是目前業(yè)界已經(jīng)使用的人工智能的算法,更準(zhǔn)確的叫法是大數(shù)據(jù)人工智能。利用深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)還有漣漪效應(yīng),共同養(yǎng)成我們現(xiàn)在的視覺、聽覺和自然語言處理方面的能力。
最后,胡郁還介紹了“訊飛超腦”的最新進(jìn)展。包括最新發(fā)布的產(chǎn)品AIUI,可以把對話的成功率從40%提升到90%以上;語音合成技術(shù),可以讓奧巴馬為科大訊飛“代言”;口語評測系統(tǒng),可以聽懂口語并給予評價;此外,科大訊飛正在參與研發(fā)一款能參加高考的機(jī)器人。
以下是胡郁演講內(nèi)容,經(jīng)鈦媒體編輯:
在過去的兩年當(dāng)中,人工智能突然變得非常熱,很多人變得很興奮。但是也衍生了很多問題,就像主持人說的,人工智能在3月份戰(zhàn)勝了世界圍棋大師李世石九段,很多人就以此推斷說人工智能要顛覆人類,甚至要滅絕人類的時間不遠(yuǎn)了,但是是不是真的這樣呢?
人工智能的發(fā)展史
講到人工智能這個話題,要回溯到1946年世界上第一臺電子計算機(jī)埃尼阿克的誕生,埃尼阿克產(chǎn)生以后,許多的計算機(jī)科學(xué)家對于計算機(jī)將來能夠代替人類做什么事情有很多聯(lián)想,其中最著名的一個人是圖靈。圖靈在二戰(zhàn)的時候發(fā)明了非常重要的炸彈,這個炸彈可以破解當(dāng)時德國的密碼體系。在二戰(zhàn)以后,埃尼阿克發(fā)明以后,圖靈在1950年左右在人工智能領(lǐng)域進(jìn)行了很多的探討,并且提出了著名的圖靈測試。
但是真正的“人工智能”這個詞被提出來,是在1956年Dartmouth的會議上。今年是“人工智能”這個詞被提出來60周年。當(dāng)年在Dartmouth提出來“人工智能”的人,包括明斯基、西蒙、麥卡塞等等,這些年輕的學(xué)者提出“人工智能”這個概念以后,他們中間誕生了四位圖靈獎得主。時光荏苒,最后的一名參與者也已經(jīng)去世了,但是我們已經(jīng)可以看到人工智能的發(fā)展。
但是人工智能的發(fā)展也不是一帆風(fēng)順的。當(dāng)一項新技術(shù)出現(xiàn)在人類社會的時候,大家會抱以非常高的期望。在人工智能剛剛提出的時候,所有人都認(rèn)為用規(guī)則推理的方法可以解決這個問題。因為當(dāng)時的計算機(jī)、存儲和各個方面的原因,當(dāng)時是大型機(jī)的時代。IBM的總裁曾經(jīng)說過,世界只需要五臺計算機(jī),事實證明他錯了。但是人工智能經(jīng)過了五六十年代的發(fā)展,離大家的期望很遠(yuǎn),所以人工智能進(jìn)入了沉寂期。隨著80年代個人電腦的發(fā)展,人工智能再次引起了大家的關(guān)注。以日本的第五代計算機(jī)為重要的表現(xiàn),中國的863計劃也設(shè)計了智能計算機(jī)主題。
中國現(xiàn)在領(lǐng)先世界的超算,包括科大訊飛本身都得益于國家863計劃在智能計算機(jī)這個主題下很多的投入和創(chuàng)新。但是其中一個非常有名的例子大家都知道,在90年代人工智能又再次陷入了低谷,因為很多人發(fā)現(xiàn),互聯(lián)其實可以幫助我們解決很多的問題,我們的信息化技術(shù)能夠解決我們生活中大部分的問題,我們并不需要人工智能,而且人工智能也做不到。進(jìn)入二十一世紀(jì),特別是隨著移動互聯(lián)網(wǎng)和互聯(lián)網(wǎng)的發(fā)展,我們再次發(fā)現(xiàn),人工智能其實是有可能做得到的,等一下我會給大家闡述一下為什么能做得到。
人工智能與人類的關(guān)系
有一個非常重要的話題,人工智能會不會威脅人類?會不會搶去我們的飯碗?Gartner的一個報告,說到人工智能越來越多的參與到我們的生活當(dāng)中去。德勤的報告分析了現(xiàn)在人類的工作,有多少已經(jīng)被現(xiàn)在已經(jīng)可以用的人工智能的技術(shù)所代替。其中有一個好消息,CEO大概只有20%的工作可以被代替。我們的園丁、清潔工被代替的比例更低,只有10%。但是也有一個不好的消息,今天在座的各位可以看到,機(jī)器人可以直接幫大家把語音轉(zhuǎn)寫成文字了,這個對于記者來說是好事。但是同時它也會開始寫稿了,最近在美國,包括騰訊的一些人工智能的技術(shù)都已經(jīng)在展現(xiàn),說機(jī)器人如果寫報道類的,陳述性的稿件也許比人還要精確。
我們其實也可以看到,人工智能的發(fā)展并不是一個線性的。大家都知道,我們今天的宇宙其實是在100多億年前有一個經(jīng)典大爆炸,但是人工智能的發(fā)展經(jīng)過60年來的跌宕起伏是不是也面臨著同樣的境地呢?很多人相信,包括雷·科茲威爾,他說2045年人工智能將會有爆炸式的發(fā)展,很多人罵他是騙子。事實證明,在數(shù)字的世界里面,確實人工智能是有可能在一個基點上發(fā)生變化的。但是我們也知道很多現(xiàn)實的東西,比如說我們的能源、材料和物理世界變化沒有這么大。所以我覺得這中間可能是一個非常顛覆的問題,我們在將來的二十年當(dāng)中會取得令人驚訝的變化,但是人工智能是不是會顛覆人類?我覺得今天的C+峰會其中有一個話題非常有意思,就是意識方面,我等一下會講到。
在過去的幾年當(dāng)中,大家已經(jīng)接受互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)作為基礎(chǔ)設(shè)施,就像我水和電一樣進(jìn)入到我們的生活。在將來的10年,人工智能也會像技術(shù)和服務(wù)進(jìn)入到我們的生活當(dāng)中,每個人都離不開。人工智能之所以受到這么廣大的關(guān)注,不僅僅是因為這個技術(shù)炫,而是影響到我們的生活,不僅關(guān)系到我們每個人,還關(guān)系到我們國家。據(jù)我所知,美國的國防部長卡特最近去了一趟硅谷,因為美國想在將來繼續(xù)維持霸主地位,非常重要的就是希望在軍事上率先做出無人戰(zhàn)車的部隊和無人艦艇的部隊。大家都知道,人工智能的人才非常昂貴,所以卡特要專門跑到硅谷去找人,那是國家的必爭之地。
認(rèn)知智能是人工智能戰(zhàn)勝人類的關(guān)鍵節(jié)點
要回答這個問題,其實我們要先看一下人類。意大利一名很年輕的歷史學(xué)家雅克·阿塔利寫了一本書,叫做《人類簡史》。他提出了一些非常重要的現(xiàn)代近代考古學(xué)上的發(fā)展,因為基因技術(shù)的發(fā)展,我們知道地球上所有的人類,包括白色人種、黃色人種、黑色人種、棕色人種,我們的祖先都來自于非洲的智人。在智人以前,地球上的猿人已經(jīng)存在了三四百萬年,在舊石器時代和新石器時代,在中國有我們講的元謀人、山頂洞人、藍(lán)田人等等,但是他們不是我們的祖先。為什么在七萬年前,智人滅了其他的猿人,獲得了真正的地球的統(tǒng)治者的地位?
其實那本書寫得非常清楚,就是在七萬到兩萬年之前,人類有農(nóng)業(yè)革命、工業(yè)革命,還有一個重要的革命是認(rèn)知革命。而認(rèn)知革命是人類用語言和智能戰(zhàn)勝其他猿人的非常重要的方面,因為有幾個方面的事情:一是可以把客觀事件描述得準(zhǔn)確;二是八卦,我曾經(jīng)以為八卦是女性社會非常不好的習(xí)慣,但是沒想到是非常重要的,由原來的100人的團(tuán)隊可以變成150人到1000人的團(tuán)隊。因為有了語言,我們可以交流我們在做夢中,或者我們思維里面的東西,我們可以產(chǎn)生虛構(gòu)的概念,我們可以產(chǎn)生宗教、公司等等,從而讓我們?nèi)祟惓蔀榈厍虻闹髟住?/p>
這位老兄雅克·阿塔利最近又寫了一本書叫《未來簡史》。我曾經(jīng)說過,因為我們現(xiàn)在的人工智能跟我們的意識其實根本沒有任何的關(guān)系,所以我并不認(rèn)為機(jī)器的發(fā)展將來能夠殘害人類或者替代人類,但是雅克·阿塔利說即使機(jī)器不會產(chǎn)生自我意識,當(dāng)它的智能達(dá)到一定程度以后,所有的人類都會懶惰到躺在那里等死而已。當(dāng)然我非常不認(rèn)同這一點,我要看看《未來簡史》寫出來以后到底怎么樣。
在過去幾年,許多媒體接受了這樣一個觀點,關(guān)于人工智能的分類。這是我提出來的,我當(dāng)時把它叫做計算智能、感知智能和認(rèn)知智能。機(jī)器發(fā)明出來以后,我們都知道計算能力和存儲能力遠(yuǎn)遠(yuǎn)的超過了人類。在運(yùn)算智能方面,機(jī)器確實遠(yuǎn)遠(yuǎn)超過人類,1997年“人機(jī)大戰(zhàn)”中戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫的超級并行計算機(jī)“深藍(lán)”。比如說阿爾法狗看過3000萬盤棋,其中2900多萬盤是自己跟自己下的,在感知這個世界。我們可以看到,我們可以聽到,我們可以感知到。機(jī)器就像動物一樣,這方面機(jī)器在快速的趕上我們,因為機(jī)器的傳感器,人工智能算法越來越清晰。在認(rèn)知方面動物和人類差得很遠(yuǎn),在政治方面發(fā)展很受限制,因為沒有語言,就沒有知識,沒有知識就不能做復(fù)雜的推理。所以認(rèn)知智能是機(jī)器智能戰(zhàn)勝人類的非常重要的節(jié)點,它們現(xiàn)在還有很大的差距。
發(fā)展人工智能的兩個思路
實現(xiàn)人工智能突破的思路其實也分為兩種,一種是我們正在參與的國家的腦科學(xué)人工智能重大規(guī)劃,我們希望通過對人類大腦的了解,能夠幫助我們設(shè)計更好的算法。但是大家知道,對于大腦的了解是一個非常漫長的過程,我們還在努力,我們跟中科院的神經(jīng)所,跟很多部門都在進(jìn)行這方面的聯(lián)系。但是另外一方面,我們業(yè)界里面現(xiàn)在已經(jīng)使用的人工智能的算法,其實應(yīng)該把它叫做大數(shù)據(jù)人工智能,它通過我們很多的技術(shù)已經(jīng)能夠了解到。
到底腦科學(xué)里面能學(xué)習(xí)什么?曾經(jīng)吳軍有一本書叫《智能時代》,里面有一種提法叫“鳥飛派”,當(dāng)我們要學(xué)習(xí)飛翔的時候,我們最先想到的是像鳥去飛,我們把身上貼滿羽毛找一個高一點的地方來跳,相信大家都知道。但是后來人類發(fā)現(xiàn)了空氣動力學(xué),我們造出了比鳥更好的設(shè)備。當(dāng)我們研究大腦的時候,我們不一定要把大腦完全的復(fù)制和克隆出來,我們可以找到這里面的智能。我相信我們可以找到關(guān)于腦神經(jīng)學(xué)習(xí)的機(jī)理、機(jī)制、結(jié)構(gòu)這些方面可以幫助我們。
但是另外一方面,在當(dāng)前的工業(yè)界,真正的已經(jīng)能夠看到的是什么呢?是我們利用深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù),還有我們的漣漪效應(yīng),來共同的養(yǎng)成我們現(xiàn)在的視覺、聽覺和自然語言處理方面的能力。這方面我要介紹一下漣漪效應(yīng),漣漪效應(yīng)和網(wǎng)絡(luò)效應(yīng)有點類似,是利用我們互聯(lián)網(wǎng)思維來解決人工智能的思路。因為大家都知道,任何一項人工智能出來的時候不那么先進(jìn),但是需要真實的人員用它,貢獻(xiàn)真實的數(shù)據(jù)和經(jīng)驗,就做一個產(chǎn)品放到這里面去。當(dāng)一個水滴滴到水面的時候它的擴(kuò)散是需要時間的,這個時間慢慢的擴(kuò)散越多,使用的人越多,這個水滴有錯誤的誤差,一開始的錯誤是很大的,當(dāng)越來越多的人用的時候,技術(shù)就改進(jìn)了,傳播得越廣錯誤就越小。當(dāng)沒有傳播到整個人群的時候,已經(jīng)訓(xùn)練得很好了,這個水波紋已經(jīng)慢慢消失了。但是對于剛接觸到它的人,會覺得這個東西怎么這么好,這就是我們現(xiàn)在做人工智能的思路。
“訊飛超腦”的最新進(jìn)展
科大訊飛正在做的一件事情就是“訊飛超腦”,我們要做語音和語言為入口的機(jī)器認(rèn)知革命。這里面包括感知智能和認(rèn)知職能。通過模仿我們?nèi)祟惖母兄悄?,上升到人的認(rèn)知的層面,我們有個Think Machine,可以對你的概念進(jìn)行推理和解決。解決完了之后有一個執(zhí)行,這一項技術(shù)我們其實最近已經(jīng)取得了很好的成果。
大家都知道我們的聲音其實在我們的腦海里面,在聲音處理里面能夠看到有一個語音譜圖。非常牛的人員,利用這個語音譜圖來判斷。我們現(xiàn)在做的成果可以利用圖像處理的方法處理我們的語音,跟我們耳朵里面的聽覺系統(tǒng)是非常接近。不僅僅如此,更加重要的是解決認(rèn)知的問題,里面包括語音翻譯、知識表示、聯(lián)想推理和自主學(xué)習(xí)。我們也有非常多的核心的模塊,包括自主的語意表示,進(jìn)行邏輯推理。
我們借用了人腦里面非常重要的注意力模型。女性開車的時候,視野很窄,所以說大部分的女性同胞可能出事故的情況比較多。我們最新發(fā)布的一個產(chǎn)品是AIUI,我們非常希望能夠跟所有的智能硬件進(jìn)行非常自然的交互。但是大家都知道,用過語音交互的人,雖然訊飛語音云現(xiàn)在已經(jīng)為18萬的開發(fā)者每天提供超過25億次的語音服務(wù),而且我們還連接到8到9億臺設(shè)備,但是他們的感覺坦白來說并不好。利用的AIUI,我們將原來單次的交互變成全智能的交互,我們將語音識別、語音合成、自然語言理解和整個對話過程融為了一個整體?,F(xiàn)在國內(nèi)百分之八九十的產(chǎn)品都會連接到我們新的AIUI的產(chǎn)品上,給我們帶來不同的體驗。采用這項技術(shù)之后,我們對話的成功率從40%提升到了90%以上。
另外訊飛超腦在感知認(rèn)知方面的兩項成就,我給大家簡單介紹一下:
一個是口語評測,大家都知道,全世界都沒有口語考試,為什么?因為口語考試沒有辦法改卷子。廣東省曾經(jīng)在高考中考過一次口語,77萬考生錄下音來以后,找了2千個英語的老師和師生來聽,改了兩個星期都沒有改完,而且壓力非常大。但是我們現(xiàn)在用機(jī)器的方法,可以自動的聽懂你的口語里面說什么,還給你評價,你怎么樣讀錯了,你的語音、語義這方面都可以評價出來,現(xiàn)在世界上只有中國在廣西、廣東、江蘇可以中考里面考英語口語。
不僅僅可以考口語,我們還可以考手寫作文,我們可以對你的作文進(jìn)行評價和批改。我現(xiàn)在還在帶領(lǐng)863的一個專家團(tuán)隊,應(yīng)該說是國內(nèi)最大的一個團(tuán)隊。31家單位參加,近幾百個老師,上百個教授在參與的中國的高考機(jī)器人,就是我們要做一個機(jī)器人參考高考,之后還能考上清華北大,看到題目之后它就可以給出答案,其實考試是評價人工智能一個非常重要的方法。
更多深度觀點,關(guān)注鈦媒體微信號:鈦媒體(ID:taimeiti)
鈦媒體微信二維碼






快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機(jī)號后發(fā)表評論
好好商業(yè)化,我等著呢
人工智能這個話題是繞不過去的
在一起吃晚餐時的