GPT-5支持高達(dá)400,000個(gè)token的上下文長度,其中輸入272,000個(gè)、輸出128,000個(gè)token 。這遠(yuǎn)超此前GPT-4默認(rèn)的8K-32K窗口,甚至超過Gemini據(jù)傳的100萬token上下文 。超長上下文讓GPT-5可處理超長文檔和多輪復(fù)雜對(duì)話,執(zhí)行跨文件、跨會(huì)話的推理任務(wù)而游刃有余。

同時(shí)GPT-5具備完整的多模態(tài)能力:文字、圖像、語音甚至可能包括視頻,都能在同一接口下被理解和生成 。用戶不再需要在不同AI服務(wù)之間來回切換,一個(gè)GPT-5即可“通吃”視覺與聽覺信息。

除了“看得見”的能力提升,GPT-5在隱性的推理策略上也更智能。

OpenAI介紹GPT-5能根據(jù)需求調(diào)整推理強(qiáng)度:簡單任務(wù)快速出結(jié)果,遇到復(fù)雜問題則自主進(jìn)入“深思考”模式,提高思考深度 。例如在代碼調(diào)試場景下,GPT-5可以先嘗試快速修復(fù),如不奏效再逐步加深分析,避免每次都全功率運(yùn)行浪費(fèi)算力。這種自適應(yīng)的智能調(diào)度歸功于內(nèi)置的路由模塊和鏈?zhǔn)酵评韮?yōu)化,讓模型懂得權(quán)衡速度與精度。再結(jié)合OpenAI宣稱的幻覺率降低(錯(cuò)誤生成降低45% )以及對(duì)指令的更高忠實(shí)度,GPT-5無疑將AI助手的可靠性推上了新的臺(tái)階。

距真正的AI Agent還有多遠(yuǎn)?

發(fā)布會(huì)上,Altman雖然淡化了AGI概念,但行業(yè)共識(shí)是:GPT-5已比肩初級(jí)Agent雛形——它具備了鏈?zhǔn)剿伎肌⒍嗖綀?zhí)行和工具調(diào)用等Agent關(guān)鍵要素。

然而,要判斷GPT-5是否真正成為智能Agent,我們需要審視其能力邊界和短板。

從能力上看,GPT-5較前代在自主性和持續(xù)推理方面有明顯進(jìn)步。OpenAI專門針對(duì)模型的自主決策、協(xié)作溝通和測試能力進(jìn)行了微調(diào)訓(xùn)練,使GPT-5在執(zhí)行復(fù)雜任務(wù)時(shí)更加主動(dòng)。以編碼助手為例,GPT-5可以連續(xù)工作數(shù)分鐘,調(diào)用多種工具來完成一個(gè)復(fù)雜編程指令,期間會(huì)主動(dòng)輸出計(jì)劃、步驟和狀態(tài)更新,“一GPT一人一公司”,指日可待。

過去模型往往一問一答,被動(dòng)等待指令,而GPT-5在工具調(diào)用間隙會(huì)提出下一步建議,無需用戶事無巨細(xì)地確認(rèn)每一步 。這種近似Agent的鏈?zhǔn)剿季S和自主執(zhí)行,使其在復(fù)雜場景下的表現(xiàn)大幅提升。據(jù)測試,GPT-5的深度推理模塊(GPT-5-thinking)可用更少的tokens完成復(fù)雜問題,比前代模型減少50%-80%的步驟開銷。這表明GPT-5已經(jīng)初步具備了長鏈任務(wù)規(guī)劃和優(yōu)化執(zhí)行的能力。

更重要的是工具使用能力的飛躍。OpenAI報(bào)告稱,GPT-5在嚴(yán)格評(píng)測的多工具使用基準(zhǔn)τ^2-bench上得分高達(dá)97%,而此前所有模型均未超過49%。GPT-5能可靠地串聯(lián)多個(gè)操作步驟完成真實(shí)世界任務(wù)。例如在客戶服務(wù)場景,GPT-5可以一邊與用戶對(duì)話,一邊調(diào)用數(shù)據(jù)庫查詢,再根據(jù)實(shí)時(shí)狀態(tài)采取后續(xù)行動(dòng),其對(duì)工具指令的遵循度和出錯(cuò)處理能力均創(chuàng)下紀(jì)錄。這些結(jié)果證明,GPT-5已掌握了相當(dāng)程度的Agent式工具調(diào)度與環(huán)境交互本領(lǐng),朝著通用智能體又邁進(jìn)一步。

然而,GPT-5離真正的自主智能Agent仍有關(guān)鍵差距。

OpenAI自己也承認(rèn),GPT-5在持久記憶、自主性和跨任務(wù)適應(yīng)性上依然存在明顯限制 。它無法像人一樣持續(xù)積累長期記憶——一旦超出400K上下文,它對(duì)更久遠(yuǎn)交互的“記憶”依然會(huì)丟失,需要借助外部數(shù)據(jù)庫或記憶模塊。

在自主性上,雖然GPT-5更主動(dòng),但終究還是遵循人類提示觸發(fā),尚不能自主產(chǎn)生新目標(biāo)或自行啟動(dòng)任務(wù)。它執(zhí)行多步流程時(shí)雖更流暢,但對(duì)未明確指示的新情景,缺乏真正的創(chuàng)造性應(yīng)對(duì),這在模擬真人智能方面仍有差距。這從一些測試可以看出端倪:在被譽(yù)為AGI終極挑戰(zhàn)的Arc Prize測試中,GPT-5表現(xiàn)遠(yuǎn)不及對(duì)手Grok-4,甚至“被人類專家輕松甄別”。OpenAI發(fā)言人也強(qiáng)調(diào),GPT-5的新功能主要是現(xiàn)有功能改進(jìn),并未徹底解決自主性難題 。

不過,可以確定的是:Agent時(shí)代,GPT-5也許只差臨門一腳。

OpenAI的下一戰(zhàn)

OpenAI 此次五模齊發(fā)的背后,已經(jīng)折射出其構(gòu)建“AI 操作系統(tǒng)”式平臺(tái)架構(gòu)的野心。

GPT-5 不再是單一模型,而是一個(gè)由多種規(guī)格協(xié)同組成的“模型矩陣”,可根據(jù)任務(wù)復(fù)雜度動(dòng)態(tài)調(diào)用“深度思考”或高效輕量模型。“GPT-5 大賭注在于合一。”Sam Altman指出,GPT-5 實(shí)現(xiàn)了從 GPT-4 手動(dòng)切換到系統(tǒng)自動(dòng)路由的架構(gòu)升級(jí),真正做到“合一”。同時(shí)推出的 GPT-5-mini 和 GPT-5-nano 以更低成本提供 400K 上下文和多模態(tài)能力,OpenAI 試圖通過高低搭配,覆蓋全場景智能需求。

如果說多型號(hào)矩陣是“AI 操作系統(tǒng)”的內(nèi)核,那么 OpenAI 正在搭建的周邊生態(tài)則是操作系統(tǒng)的“框架和接口”。其 Assistants API(助理接口)讓開發(fā)者能夠構(gòu)建定制的 GPT 助手,將模型變成可嵌入任意應(yīng)用的智能Agent;ChatGPT 插件充當(dāng)擴(kuò)展工具,為 GPT 提供調(diào)用外部服務(wù)和實(shí)時(shí)數(shù)據(jù)的能力,如同AI世界的應(yīng)用商店;而定制模型接口則意味著開發(fā)者可以接入自有模型或定制版本,與OpenAI平臺(tái)打通。

Sam Altman的愿景更加直白。他曾表示OpenAI的目標(biāo)不是成為某個(gè)應(yīng)用上的贏家,而是要“成為其他一切構(gòu)建其上的那一層” 。換言之,OpenAI 希望充當(dāng)AI時(shí)代的底層平臺(tái),讓別的應(yīng)用都建立在自己的“AI操作系統(tǒng)”之上。

為此,OpenAI 正不斷豐富平臺(tái)組件:從最新的 GPT-5 模型矩陣,到插件體系、助理API,再到開放模型發(fā)布。

一方面,ChatGPT 已從最初的對(duì)話機(jī)器人躍升為集成搜索引擎、插件工具等于一身的“AI萬能應(yīng)用” ;另一方面,OpenAI 開始松動(dòng)封閉策略,首度開源高性能模型,發(fā)布了自 GPT-2 以來首批開放權(quán)重的大模型gpt-oss 系列,允許開發(fā)者免費(fèi)下載、定制和離線運(yùn)行  。

這被視為OpenAI 向構(gòu)建生態(tài)邁出的關(guān)鍵一步:通過 Apache 2.0 開源許可證將自家模型“交到更多人手中” ,以吸引開發(fā)者深度參與,夯實(shí)其平臺(tái)地基。

歷史的回響:封閉崛起還是碎片開放

各家大模型之爭,讓人不由想起科技史上的多次“宿命對(duì)決”。

智能手機(jī)時(shí)代,蘋果憑借封閉的軟硬件一體化為用戶帶來極佳體驗(yàn)和高粘性生態(tài),建立起牢固的盈利壁壘;而谷歌主導(dǎo)的Android開放授權(quán)給眾多廠商,贏得了市場占有率但也付出碎片化和生態(tài)良莠不齊的代價(jià)。

類似的劇情正投射到AI領(lǐng)域:OpenAI模式頗似當(dāng)年的蘋果,通過性能拔尖的GPT-5模型和自有平臺(tái)把關(guān)用戶體驗(yàn),以封閉換取質(zhì)量和商業(yè)回報(bào);Anthropic、Meta等提倡的開源開放更像Android陣營,意圖聯(lián)合多數(shù)、快速鋪開,讓“AI大國民”遍地開花,但同時(shí)如何治理眾多版本和標(biāo)準(zhǔn)成為挑戰(zhàn)。

過往多次經(jīng)驗(yàn)顯示,封閉生態(tài)往往在早期憑借卓越體驗(yàn)迅速崛起,而開放生態(tài)則憑借規(guī)模和低門檻后來居上。AI操作系統(tǒng)之爭會(huì)重演這一幕嗎?抑或會(huì)走出第三條道路?這是大家十分關(guān)心的問題。

云計(jì)算領(lǐng)域,亞馬遜AWS以IaaS起家,但真正讓其難以撼動(dòng)的是一系列PaaS產(chǎn)品:開發(fā)者一旦使用了AWS提供的數(shù)據(jù)庫、消息隊(duì)列、函數(shù)計(jì)算等托管服務(wù),就被牢牢綁定在AWS生態(tài)中。對(duì)照來看,OpenAI 顯然也在從“提供模型算力”向“提供完整平臺(tái)服務(wù)”演進(jìn)。

當(dāng)年有人將AWS稱為“新操作系統(tǒng)”,因?yàn)閼?yīng)用直接基于其API構(gòu)建而不感知底層服務(wù)器;今天,OpenAI 何嘗不是在打造AI時(shí)代的新操作系統(tǒng)?開發(fā)者調(diào)用的是OpenAI的接口,背后用的模型、算力甚至插件生態(tài)都由OpenAI打包提供。如果說AWS壟斷了云端基礎(chǔ)設(shè)施接口,那么OpenAI正嘗試壟斷AI智能層接口。

值得注意的是,AWS生態(tài)的壯大并非依靠開源,而是靠易用性與先發(fā)優(yōu)勢形成事實(shí)標(biāo)準(zhǔn)。OpenAI的策略與此有異曲同工之妙:搶先占領(lǐng)市場心智,讓GPT API和插件成為開發(fā)者默認(rèn)選項(xiàng),即便后來的競爭對(duì)手開放源碼或降價(jià),已難以扳動(dòng)其生態(tài)地位。

當(dāng)然,歷史類比并非預(yù)言。移動(dòng)生態(tài)最終是雙雄并立,云計(jì)算領(lǐng)域后來者微軟Azure、谷歌云也各有一席之地。

當(dāng)下AI平臺(tái)大戰(zhàn)格局更為復(fù)雜:巨頭結(jié)盟與競爭交織,開放與封閉界限日趨模糊。或許未來的AI世界,不會(huì)簡單復(fù)制某一過往戰(zhàn)役的結(jié)局,但商業(yè)與技術(shù)演進(jìn)的底層邏輯卻驚人相似:用戶體驗(yàn)、開發(fā)者生態(tài)、標(biāo)準(zhǔn)控制,這三大要素始終決定著平臺(tái)戰(zhàn)爭的走向。

OpenAI 究竟是在打造一個(gè)人工智能的“操作系統(tǒng)”,還是野心勃勃地想要定義整個(gè)AI技術(shù)棧、云服務(wù)乃至應(yīng)用范式的未來?這場“模型即平臺(tái),接口即邊界”的群雄逐鹿才剛剛開始,答案有待時(shí)間去揭曉,懸念也留給我們所有人去思考  。

本文系作者 極新 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接
本內(nèi)容來源于鈦媒體鈦度號(hào),文章內(nèi)容僅供參考、交流、學(xué)習(xí),不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn),點(diǎn)擊這里投稿 。創(chuàng)業(yè)或融資尋求報(bào)道,點(diǎn)擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評(píng)論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論

請(qǐng) 登錄后輸入評(píng)論內(nèi)容

快報(bào)

更多

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議,涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi),已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時(shí)實(shí)施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會(huì)預(yù)判:百億智能體或成新物種,AI推動(dòng)人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價(jià)4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實(shí)

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個(gè)詞的搜索量最高一天達(dá)到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個(gè)可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動(dòng)2026”在北京啟動(dòng)

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級(jí)人民政府負(fù)責(zé)人,督辦“3?15”晚會(huì)曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個(gè)月中國創(chuàng)新藥對(duì)外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會(huì)議

2026-03-28 17:30

印尼正式實(shí)施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動(dòng)

掃描下載App