Cohere聯(lián)合創(chuàng)始人艾丹·戈麥斯(Aidan Gomez)(圖片來源:多倫多大學(xué))

艾丹·戈麥斯(Aidan Gomez)是一位著名的AI研究者,也是Cohere的聯(lián)合創(chuàng)始人。他是少數(shù)在Google Brain工作時創(chuàng)造Transformer算法的研究者之一。此次交流中,他談到了自己的經(jīng)歷以及他的初創(chuàng)公司Cohere,該公司以他早些時候的工作為基礎(chǔ)。

戈麥斯在加拿大長大,后來他去了多倫多大學(xué)學(xué)習(xí)。在那里,他在大二的時候發(fā)現(xiàn)了人工智能,并開始狂熱地閱讀有關(guān)該主題的學(xué)術(shù)論文,是一名機器學(xué)習(xí)研究員和數(shù)學(xué)迷。

“我變得癡迷,我就是日夜不停地閱讀論文,”他回憶說。“我會帶著一篇研究論文入睡。”

他在文獻中一直看到一個名字——杰夫·辛頓(Geoffrey Hinton )——他的附屬機構(gòu)也是多倫多大學(xué),盡管辛頓早已停止教學(xué)。戈麥斯通過電子郵件與他聯(lián)系,向辛頓提出一個小技術(shù)問題。令他驚訝的是,辛頓回應(yīng)了他,這位世界上最著名的AI研究者向一個當時還是匿名的本科生解釋了一個普通的問題。

在他的本科學(xué)習(xí)期間,戈麥斯前往科技創(chuàng)新的中心——硅谷——那里他成為了著名的Google Brain團隊的一名實習(xí)生。在那里,他與領(lǐng)域內(nèi)一些最聰明的人合作,包括在開發(fā)谷歌TensorFlow模型框架中發(fā)揮了重要作用的Lukasz Kaiser。

“Kaiser想把機器學(xué)習(xí)研究者們編譯的每一個數(shù)據(jù)集都放入一個模型中,使其在輸入和輸出方面都完全Multi-model(多模態(tài))。”戈麥斯說。

為了支持這個項目,戈麥斯幫助建立了一個名為Tensor2Tensor的軟件基礎(chǔ)設(shè)施,該設(shè)施可以在成千上萬的GPU之間分配計算任務(wù)。他說,這主要集中于自回歸模型,特別是基于注意力的模型。“我們聽說Google翻譯的一個團隊也對基于注意力的自回歸模型感興趣,Lukasz說服他們過來,并在Tensor2Tensor上構(gòu)建它。”

接下來的10周,我們一直在趕制這個模型。“由于我們得到的結(jié)果非常出色,所以壓力只是越來越大,”戈麥斯回憶道。“這是早期非常成功、可以大規(guī)模擴展的架構(gòu)之一,我們的大規(guī)模GPU集群帶來了極高的性能。”

“沒人在睡覺;我每天工作14個小時編碼,建設(shè)這個基礎(chǔ)設(shè)施,使它更為健壯,運行實驗,這就是我們得到變壓器算法的方式。”

現(xiàn)在,Transformer算法只有大約20行代碼?;緦邮且粋€多層感知器(MLP),Transformer實際上只是一些堆疊在一起的MLP和一個注意力層。在Transformer之前,有這些非常復(fù)雜的LSTM架構(gòu),沒有統(tǒng)一的架構(gòu)。有了Transformer,所有這些都被拆除,留下的是簡單的、表現(xiàn)良好的、可擴展的“內(nèi)核”東西。

Transformer算法為先進的自然語言處理打開了大門,使機器能夠理解和生成類似人類的語言。OpenAI的首席科學(xué)家Ilya Sutskever立即利用它建立了第一個生成預(yù)訓(xùn)練Transformer模型——GPT,現(xiàn)在已經(jīng)發(fā)展到第四代GPT-4。Transformer引領(lǐng)了正在改變世界的生成AI革命。

戈麥斯接著共同創(chuàng)立了一家公司,Cohere,目的是使人們能夠接觸到這種變革性的算法和圍繞它構(gòu)建的大型語言模型。Cohere致力于使LLM(大型語言模型)盡可能地實用和有用,以滿足不同的垂直任務(wù)和行業(yè)的需要。

戈麥斯大部分時間都沒有參與關(guān)于生成式AI(AIGC)對人類的威脅的辯論。但考慮到AI近期的顯著進步,戈麥斯表示,越來越難以否認機器獲得感知能力的想法。

隨著AI感知潛力的展現(xiàn),戈麥斯強調(diào)了負責任開發(fā)和倫理考慮的重要性。他呼吁AI社區(qū)以保護人類價值、隱私和社會福祉的承諾來面對進步。他相信,通過培養(yǎng)對AI開發(fā)的深思熟慮和透明的方法,我們可以減少風險,最大化它所提供的好處。(本文首發(fā)鈦媒體App)

本文系作者 Craig Smith 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負責人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

掃描下載App