圖片由AI生成

高考,中文世界權(quán)威度和認可度最高的標準化考試,世界上最公平的大型選拔考試之一,還在如期進行中。

這項考試制度成熟、人數(shù)眾多、標準統(tǒng)一,各科命題經(jīng)過多輪審定,閱卷過程統(tǒng)一標準、分數(shù)精確??荚嚳既〉姆謹?shù)背后,看似是對知識點和做題能力的展示,實則揭示的是其抽象邏輯、信息整合、快速運算和寫作表達等能力。

尤其是邏輯思考和推理能力,是學生時期被重點訓練的素養(yǎng),是績優(yōu)生引以為傲的資本,進入社會用來吃飯的看家本事,而當今年大模型深度思考能力全面開花之際,想必大多數(shù)學霸會產(chǎn)生一種別樣的復雜的心情。

當然了,高考的特殊性,使其成為了大模型能力的天然試金石。高考期間,哪家大模型解題能力強,綜合評分到底可以上幾本學校,成為很多人津津樂道的話題,今年類似相關(guān)的測評文章也零星出現(xiàn)了。

而當隨機測試了下市面上主流通用大模型解答高考題時,結(jié)果卻出人意料——這些大模型壓根沒有想要參加高考。

上傳了高考全國卷I數(shù)學試題后,有的大模型顯示無法上傳,有的則表示無法識別。而一同被“禁言”的解讀的,還有往年的高考數(shù)學題。
各大主流國產(chǎn)模型廠商對今年高考數(shù)學題的回應(yīng)

高考期間(6月7日-10日),主流國產(chǎn)模型廠商對今年高考數(shù)學題的回應(yīng)

事實上,不只是數(shù)學難題,國產(chǎn)大模型已經(jīng)屏蔽掉了K12階段學科(語文、數(shù)學、英語、物理、化學、生物、歷史、地理、政治)內(nèi)容的部分推理與解析能力。具體而言是,圖片識題(拍題)功能禁用,高考真題關(guān)鍵詞屏蔽,甚至禁止回答具體某年高考題目。
DeepSeek對高考以及高考題相關(guān)的話題限制非常嚴格,而給出略顯詳細的提示詞后,會給出豐富的答案。

高考期間(6月7日-10日),相比其他大模型應(yīng)用,DeepSeek對高考以及高考題相關(guān)的話題限制更為嚴格,而給出略顯詳細的提示詞后,也會給出豐富的答案。

也就是說,在今年高考期間,主流的國產(chǎn)模型廠商,都主動或被動對高考采取了限制措施,這在國產(chǎn)大模型發(fā)展進程里還是頭一回。

實際上,ChatGPT、Claude等國外的大模型可以解答今年高考相關(guān)題目,并且以高水平完成推理過程。而大多數(shù)國產(chǎn)通用大模型,已經(jīng)在多項技術(shù)指標上持續(xù)逼近全球頂級水平,甚至在某些垂直細分場景呈現(xiàn)領(lǐng)先的趨勢,也意味著它們是具備足夠的能力來解答這些題目的。

很顯然,這一次功能“降級”,本質(zhì)上是一次策略性的行為,也是平臺技術(shù)治理與內(nèi)容安全機制的體現(xiàn)。

當前,多數(shù)模型處理高考題的模式是,當識別到題干結(jié)構(gòu)類似高考題(選擇題、大題、簡答題),會直接返回“不支持”或“無法識別”。而圖片上傳識別時,系統(tǒng)會直接禁掉OCR模塊或限制調(diào)用次數(shù)。與此同時,也對“高考”,“高考真題”等關(guān)鍵詞自動限流。這是大模型的內(nèi)容風險識別系統(tǒng)在發(fā)揮作用。

這一場高考期間“特別監(jiān)管”,目前各大廠商未主動發(fā)布官方聲明。而最直接的原因,恐怕是為了防止高考考試作弊。因為多數(shù)模型廠商直接在頁面給出文字提示,無法支持相關(guān)功能,是“為了保證高考公平公正”,“為了確保高考的公平性”,“重要考試期間,換個話題試試”等。

但事實上,目前沒有公開報道顯示,國內(nèi)已經(jīng)有利用AI大模型在考場作弊的案例(國外大學已有識別學生利用ChatGPT作弊而被開除的案例),但確實已經(jīng)存在一些大模型相關(guān)的考試虛假信息和詐騙行為,并且已經(jīng)被監(jiān)管部門重點關(guān)注。

這里涉及的是,今年高考前,教育部、中央網(wǎng)信辦、公安部查處了部分商家。這些商家利用一些考生、家長的投機心理,將押題當成牟利工具,通過宣稱“神預測”“精準押題”、炒作“名師押題”“AI押題”等虛假宣傳手段,誘導考生、家長購買所謂的“高考押題卷”“高考猜題庫”“備考攻略”等。

與此同時,當AI大模型進入更多硬件設(shè)備而非只是手機時,與考試有關(guān)的新問題也隨之浮現(xiàn)。今年4月,《央視新聞》發(fā)出了一個疑問,“AI眼鏡成考試作弊‘神器’怎么防?”而Rokid創(chuàng)始人、CEO祝銘明就這一問題答復是,“可能最簡單的方法就是屏蔽信號或者把功能關(guān)掉”。

回到高考本身,這是我國最重要的考試之一,已經(jīng)納入國家治理的重要領(lǐng)域,現(xiàn)代教育測試學的標準性和普適性,使得高考一直被看作是教育公平與社會穩(wěn)定的制度性支柱。高考題目及其解析涉及國家教育考試制度,具有高度敏感性和保密等級,任何失誤或越界可能被定性為破壞考試秩序。

而一旦出現(xiàn)泄題或作弊的情況,都會被視為國家級事件。大模型有可能被考生用于作弊,而錯誤解答了真實或類似的高考試題,會持續(xù)引發(fā)公眾的質(zhì)疑。

事實上,監(jiān)管層在今年已經(jīng)明令禁止AI技術(shù)干擾正常的高考秩序。5月30日,教育部會同中央網(wǎng)信辦、公安部發(fā)布了消息聯(lián)合查處涉高考違法有害信息,重點整治的是,炒作夸大涉考不實信息,借AI技術(shù)生成發(fā)布涉考虛假信息,以及,干擾輿論和誤導公眾等行為。

在考試期間,涉及高考試題相關(guān)行為,可能被認定為是協(xié)助作弊,或者擾亂考試秩序,平臺將面臨監(jiān)管和法律風險。主流國產(chǎn)大模型目前仍在“合規(guī)優(yōu)先”的階段,在監(jiān)管本就密集的K12教育領(lǐng)域,冒險展示技術(shù)能力,將面臨政策、倫理和市場風險多重壓力。

而其實,如果從技術(shù)側(cè)考慮,模型廠商限制相關(guān)功能,也未必是全然是“被迫”的行為。因為AI大模型的幻覺問題始終難解,同一個提問和提示詞情況下,多次生成的內(nèi)容也不全然一致,尤其是數(shù)理等更標準化的科目,純屬將模型能力的弱項暴露給公眾。

盡管有些模型廠商已經(jīng)以“解答高考題的準確率”為賣點宣傳自身,但是,更多廠商為避免出現(xiàn)“AI答案”和“官方答案”不一致的尷尬,全部禁止作答高考題,不失為一種較為理性的決策。

不過,大模型的平臺自律與避險機制,在高考結(jié)束后,就會陸續(xù)恢復對K12內(nèi)容的部分支持,因為市場需求永遠都在那里。

一個有意思的現(xiàn)象是,今年高考期間,“高考期間能用的AI”在社交平臺上引起了小范圍的討論,而關(guān)注這一話題的,卻是大學生群體。“正在復習的大學生天塌了”,“救救大學生吧”,“高考最大的受害者出現(xiàn)”,因為當前也正值大學期末考試季。

這些在社交媒體上小范圍的“怨聲載道”,段子式的調(diào)侃,說明的是,大模型已經(jīng)深深地介入了大學生的學習、成長的主線任務(wù)。

不同于K12的解題答疑,大模型在高等教育中使用場景更為豐富,但也面臨著最為激烈的爭議。一些學校明令禁止使用,但隨著大模型的發(fā)展,有的學校和教師也鼓勵學生,以負責任的方式用AI輔助學習與研究,并允許在明確聲明的前提下適度使用AI。

即便如此,考試場景也是被各方排除在外的一個共識場景。

如何劃定學生使用AI的邊界,使用場景自然是核心要義。大模型可成為啟發(fā)式學習伙伴,尤其是深度思考普及之后。而在考試場景中,尤其是K12階段,大模型一旦越界,必然會對公平性構(gòu)成實質(zhì)破壞。

可以預期的是,未來一段時間,高考期間,國產(chǎn)大模型廠商相關(guān)功能依舊會“策略性限制”。但從長遠來看,“AI+教育”的變革不會停止。AI教師已經(jīng)是各大主流教育科技公司正在探索的方向之一。

教育大模型或者通用大模型的教育相關(guān)應(yīng)用,正確的方向是,以啟發(fā)式學習的方式,構(gòu)建知識圖譜導航,成為教師教學和學生學習的輔助工具,而非一次次簡單答案投喂,成為考試題目的解答機器。(本文首發(fā)于鈦媒體APP,作者|李程程)

本文系作者 LCC_Beta版 授權(quán)鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉(zhuǎn)載請注明出處、作者和本文鏈接。
本內(nèi)容來源于鈦媒體鈦度號,文章內(nèi)容僅供參考、交流、學習,不構(gòu)成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內(nèi)容

快報

更多

18:08

全國豬價跌破5元,創(chuàng)歷史新低

18:07

時代天使2025年實現(xiàn)收入3.7億美元,同比增長37.8%

17:57

電魂網(wǎng)絡(luò):擬投資4920萬元取得上海漫魂51%股權(quán)

17:51

美國1天超3000場反戰(zhàn)示威

17:28

雀巢12噸巧克力被盜

17:11

伊朗官員表示將“果斷反擊”美軍奪島

17:08

伊朗議長稱武裝部隊“正等著美軍地面行動”,并將“懲罰”其地區(qū)盟友

17:05

三安光電:董事長及總經(jīng)理擬增持公司股份

16:58

全球多地爆發(fā)示威抗議,民眾高呼“不要戰(zhàn)爭”

16:55

中信證券:配置上建議繼續(xù)堅守中國優(yōu)勢制造業(yè),靜待4月決斷

16:38

美國土安全部資金中斷進入第44天,創(chuàng)美國史上最長政府部分“停擺”紀錄

16:17

北京啟動智能網(wǎng)聯(lián)新能源汽車商業(yè)保險開發(fā)應(yīng)用,統(tǒng)一適配L2至L4全級別智能網(wǎng)聯(lián)新能源汽車

16:16

恒林股份發(fā)布AI體感工學白皮書,加速布局AI智能家居

16:15

中國國家創(chuàng)新指數(shù)綜合排名世界第9位,較上年提升1位

16:05

朗新科技:2025年歸母凈利潤1.05億元,同比扭虧為盈

16:05

錫業(yè)股份:2025年歸母凈利潤19.66億元,同比增長36.14%

16:04

摩恩電氣:2025年歸母凈利潤1058.2萬元,同比下降40.79%

15:50

宇信科技:2025年歸母凈利潤4.32億元,同比增長13.69%

15:50

美國多地舉行抗議示威反對特朗普政府政策

15:49

深紡織A:2025年歸母凈利潤6841.87萬元,同比下降23.44%

掃描下載App