語句解析簡要流程

1)人基于什么進行交流?

人的所有交流都基于以下五類真實的素材:

①?視覺層面:可視化方面,素材、圖畫、動作、圖景隨時間變化……

②?味覺層面:味覺感官,如:甜、苦、澀、酸……

③?聽覺層面:聽覺感官,如:音質(zhì)連續(xù)、間斷、跳躍、清晰、模糊、洪亮、清脆……

④?觸覺層面:皮膚感官,如:柔軟、堅硬、摩擦……

⑤?嗅覺層面:嗅覺感官,如:臭、香……

2)基于語境展現(xiàn)的語句分析

人類所有的交流都是基于事實的、能夠真實感受到的事物來進行的,當機器解析自然語言時,也需要將其轉(zhuǎn)成事實的、能夠真實感受到的事物。因此,“語境解析引擎”主要是將語言還原成一幅真實的圖畫,并基于“知識圖譜”、“事物組合圖譜”對其進行深度解析的一種技術。

基于語境解析引擎的自然語言理解主要包括以下幾個部分:

①?基于事物組合圖譜尋找話語語境中的類似事物組合場景;

②?用類似事物場景的各種屬性特點去理解話語場景;

③?如果針對話語語境中的某些點需要著重分析,則調(diào)取“知識圖譜”或“事物組合圖譜”數(shù)據(jù)進行深入分析。

舉例1:“狗走進了房間,他是毛絨絨的?!?/p>

“狗走進了房間,它布滿了家具?!?/p>

毛絨絨是狗的“外形表述”,家具是一個物體,房間更多是一個空間區(qū)域,布滿則是物體擺放的位置,因此,基于人工智能技術,我們很容易通過語境來理解語句的語義。

要基于事物組合圖譜進行可視化動態(tài)聯(lián)想,將一句話展現(xiàn)為一幅動態(tài)簡約語境圖畫,如下邊例子所示:

舉例2:“詠鵝”古詩用圖畫表示出來

詠鵝

鵝,鵝,鵝,曲項向天歌。

白毛浮綠水,紅掌撥清波。

基于語境解析技術將古詩語境用圖畫展示出來,如下圖所示:

3)語境分析引擎

任何一幅語境圖畫所展現(xiàn)的內(nèi)容都是無窮多的,這無窮多的可能會帶來成千上萬種語義可能,通過將語境所有事物按照可能性組合在一起,對這種事物組合的類似場景進行分析,來獲取最有可能表達的那種語義,并最終獲取某一語句表達的真實語義。

當然,語境中的事物可能會出現(xiàn)多種組合形式,每一種組合形式都可能會對應相應的語義。但語境具有糾錯機制,隨著語句的持續(xù),當發(fā)現(xiàn)前邊的理解有誤時,即前邊的某一語句表達的并不是概率最高的那個語義時,可以糾正前邊的語句語義理解。

其實從另一方面來講,“話語”本身是能表達多種含義的,而語境對語義具有限制作用,將一句話限制在某一確定的語義,也即話語能夠表達多種不同的含義A/B/C/D,每種含義的概率分別是35%、30%、25%、10%,語境將語義限制在其中的某一種,比如B。

語境對語義的制約有多種情況,比如,同樣一句話,不同身份的人所表達的語義不同。例如:

一位教師說:“明天上午八點我去上課。”

一個學生說:“明天上午八點我去上課?!?/p>

上面的兩個例句中,教師和學生雖然都說同樣的話,由于教師和學生的職務身份不同而決定了同樣一句話的語義不同,教師說這句話的意思是“去講課”,而學生說句話的意思是“去聽課”。

按照傳統(tǒng)的語句邏輯分析,很難解決這種語義分歧錯誤,但是在人工智能大數(shù)據(jù)統(tǒng)計分析的情況下,這個解決起來就太簡單了,通過大量的數(shù)據(jù)分析發(fā)現(xiàn),“學生”與“上課”這兩個事物組合到一起,99.9%的概率是去學生去聽課,So easy!

再比如,同樣的一句話,在不同的時間、地點、場合,就有不同的語義。

例如:“都八點了!”

按照傳統(tǒng)的語句解析技術,這句話很難理解,由于缺乏語境,它的語義很難確定。但是按照人工智能技術,這個問題很簡單,通過大數(shù)據(jù)分析,可以直接給出,這句話出現(xiàn)在各種場景中的概率:

①?快點走,否則飛機晚點了(0.1%)

②?快點走,否則上班時間要遲到了(15.1%)

③?快點走,否則上課要遲到了(11.1%)

④?你沒有時間概念(14%)

……

至于最終表達的是一種什么樣的含義,無所謂,隨著語境的持續(xù)而自然解決。

舉例:交通事故

一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上。這時,她發(fā)現(xiàn)前面有個老人在路邊散步,她心里很慌亂,便在背后大聲叫道:“老大爺,站一下,請站住別動!”老人隨即站住,沒有回頭,只等姑娘過去。但不幸得很,姑娘三歪兩歪一下子撞在老人身上,老人摔倒了。老人爬起來說:“我說你讓我站住干什么,原來你是要瞄準呀!”

整個段子的語言解析的字數(shù)比本文所有字數(shù)還多,簡略起見,僅對其第一句話進行解析:“一位剛學會騎自行車的姑娘,因有急事飛駛在郊外的大馬路上。”

①?“姑娘”是“女孩”的另一種稱呼,這點通過知識圖譜可以得到;

②?“自行車”是一種物體,通過知識圖譜可以查到;

③?“馬路”是“公路”或“泊油路”的另一種稱呼,是一個事物,通過知識圖譜可以查到;

④?“郊外”是一個“事物組合”,通常指麥田、道路、野草、村落等組成的場景,通過“事物組合圖譜”可以查到;

⑤?“騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態(tài),在“事物組合圖譜”里邊可以

⑥?“剛學會騎自行車”是“人”與“自行車”兩種事物組合在一起的一種運動狀態(tài)的子集,這在“事物組合圖譜”里邊可以查到;

⑦?“有急事”是“人”與“事情”兩種事物組合在一的一種狀態(tài)子集,這在“事物組合圖譜”里可以查到;

⑧?“飛馳”是車輛等事物運動過程中的一種描述,這在“事物組合圖譜”里可以查到;

⑨?基于上述這些理解與數(shù)據(jù),通過“語境解析引擎”,很容易將這句話解析出來,最后給出的是一個還原的簡略過程“描述視頻”,也即為該句話的“語境”,也即理解這句話的含義。

基于“知識單元”、“知識圖譜”、“事物組合圖譜”、“視覺解析引擎”、“語境解析引擎”等技術,已經(jīng)能夠完美搭建基于自然語言的龐大數(shù)據(jù)庫,并能夠以極高準確率識別自然語言,可以說,這已經(jīng)為真正實現(xiàn)人工智能搭建了良好的基礎,但這僅僅是整個“人工智能”技術體系中的一部分,鑒于本文篇幅,剩下的那部分將在后續(xù)的文章中展現(xiàn)給大家。

最后想說一句話:中國創(chuàng)新,改變世界!

本文系作者 張浩 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容
  • 作為一個自然語言領域的研究人員,對作者作為非專業(yè)研究人員,也沒做過多年大量實驗的情況下,能把人工智能的本質(zhì)理解到這個深度,表示不可思議。這些內(nèi)容的方向與當今的人工智能研究主流并不很一致,能這樣系統(tǒng)完整地分析人工智能的主要瓶頸問題,并提出很多學界主流沒有給與足夠關注的要點,對于一個作家來講,實在是難能可貴。

    回復 2014.10.14 · via pc
  • 這種模式的人工智能,有自我意識嗎?有創(chuàng)造力嗎?

    回復 2014.09.26 · via pc
  • 看來我已經(jīng)和這篇文章接軌了,

    回復 2014.09.24 · via pc
  • 很有內(nèi)涵,難得一見的好作品。

    回復 2014.09.24 · via pc

快報

更多

12:46

宇樹科技具身智能體驗館亞洲首店將于5月底落地上海

12:44

洛杉磯10萬人參加“不要國王”抗議,多人被捕

12:37

今年前兩月霍爾果斯口岸果蔬出口增長29.3%

11:48

中國首臺商用12兆伏串列加速器成功下線

11:40

美副總統(tǒng)稱無意滯留伊朗,將很快撤出

11:39

中關村兩院具身通用智能基座模型與社會模擬器等科研成果發(fā)布

11:37

清明檔新片預售票房突破2000萬

11:30

約千人“包圍”洛杉磯政府機構(gòu)大樓,兩人被捕

10:59

中穎電子:有序推進車規(guī)芯片研發(fā),新產(chǎn)品預期今年推出

10:50

德研究報告:中國工業(yè)數(shù)字化水平全球領先

10:39

訊飛醫(yī)療2025年營收增長25%,虧損收窄

10:14

廣東省市場監(jiān)管局聯(lián)合廣州市市場監(jiān)管局召開平臺企業(yè)座談會

10:10

貝殼啟動戰(zhàn)略變革:管理者站上一線,經(jīng)紀人KPI減負

10:06

中東戰(zhàn)事致燃油短缺,越南多家航司將削減航班數(shù)量

10:06

新研究估計全球每年逾25萬人死于腦膜炎

10:02

印尼16歲以下人群“社媒禁令”正式生效

10:01

調(diào)查顯示日本市場逾2500種食品4月份將漲價

10:01

西南首個商業(yè)衛(wèi)星遙感測運控站啟用

09:25

美國全國范圍爆發(fā)反對特朗普政府集會,預計超900萬人參與,或為“美國歷史上規(guī)模最大”抗議活動

09:23

馬斯克旗下AI公司初創(chuàng)“11羅漢”全部離職

5

掃描下載App