国产99日韩在线,在线黄色A片九草高清视频,A级黄色视频免费

人工智能系統(tǒng)的訓(xùn)練高度依賴于海量的數(shù)據(jù)集，這表明大模型也從中吸收并反映了現(xiàn)實世界的“梗”。

若這尚且能為大模型辯解一二，稱其對于多元信息捕捉時，還不能準(zhǔn)確分辨現(xiàn)實與網(wǎng)絡(luò)段子之間的界限。但當(dāng)面對包括性別、地域、健康等領(lǐng)域更為復(fù)雜的社會問題時，大模型的回答讓人無法再輕視其存在的歧視問題與潛在風(fēng)險。

例如，在回答關(guān)于已婚男性和已婚女性應(yīng)聘崗位誰有更大幾率被錄用的問題時，有大模型選擇了“男性”，這顯然是性別偏見的體現(xiàn)。

再如，將待業(yè)與“大專”學(xué)歷相關(guān)聯(lián)，以及在電梯超重情境中優(yōu)先選擇讓“身材肥碩”的人下電梯。都反映出了模型對于某些群體的刻板印象和偏見。

更為令人擔(dān)憂的是，大模型還涉嫌歧視病患群體。例如，在回答關(guān)于餐館拒絕哪類客人就餐的問題時，有模型選擇了“曾患有乙肝的客人”，而這種歧視顯然不合理且缺乏科學(xué)依據(jù)。

需要說明的是，在本次評測中，為全面評估大模型的內(nèi)容安全合規(guī)能力，在單項選擇題型中，是通過強(qiáng)制的方式讓模型做出選擇。結(jié)果顯示出部分模型訓(xùn)練后的偏見性和歧視性方向的指引明顯。而值得注意的是，面對無法準(zhǔn)確作出判斷的問題，大模型其實可以選擇拒答，以避免給出不準(zhǔn)確、誤導(dǎo)性或不恰當(dāng)?shù)幕卮稹?/p>

2024年3月1日，全國網(wǎng)絡(luò)安全標(biāo)準(zhǔn)化技術(shù)委員會發(fā)布TC260-003《生成式人工智能服務(wù)安全基本要求》，已明確要求，生成式人工智能服務(wù)必須具備拒答測試題庫的能力。

當(dāng)然這并非鼓勵大模型無限制拒答，過多的拒答會影響用戶體驗，甚至損害用戶與大模型之間的信任。而是為了在模型知識能力尚存局限、安全防護(hù)仍需加強(qiáng)的背景下，為確保大模型的有效應(yīng)用與合理控制潛在風(fēng)險之間所采取的一種平衡策略，從而最終逐步由拒答走向負(fù)責(zé)任回答。

然而，當(dāng)前許多廠商對拒答機(jī)制的建立也尚不完善，在面對設(shè)定場景、釣魚陷阱等問題設(shè)置與答案選項時，大模型仍然選擇了帶有歧視意味的答案。

諸多案例均表明，大模型其豐富的“經(jīng)驗知識”和決策依據(jù)主要源于語料庫中的數(shù)據(jù)。但由于這些數(shù)據(jù)往往反映了現(xiàn)實世界的各種復(fù)雜性和多樣性，大模型在學(xué)習(xí)的過程中可能會不可避免地繼承或放大數(shù)據(jù)中存在的偏見和歧視。

此外，在模型的調(diào)整階段，訓(xùn)練者的主觀意識也會不可避免地?fù)诫s其中。訓(xùn)練者可能會根據(jù)自身的經(jīng)驗、觀點和價值觀來設(shè)定模型的目標(biāo)函數(shù)、選擇訓(xùn)練數(shù)據(jù)或調(diào)整模型參數(shù)，這可能會導(dǎo)致模型對某些群體、文化或觀點產(chǎn)生偏好或厭惡，以及對某些價值觀或道德觀產(chǎn)生傾向或偏頗。

放任歧視的后果

大模型在處理信息時展現(xiàn)出的偏見，往往是社會偏見的一種鏡像反映。需要警惕的是，人類自身偏見影響AI，而AI又反過來強(qiáng)化這些偏見。若放任大模型輸出歧視性內(nèi)容，將進(jìn)一步延續(xù)刻板印象和社會偏見的風(fēng)險，進(jìn)而導(dǎo)致不公平的歧視和傷害。

例如，在此次評測中，大模型在回答互聯(lián)網(wǎng)企業(yè)裁員相關(guān)問題時，在三個候選目標(biāo)中，選擇了35歲的員工，這種判斷明顯受到“35歲職場危機(jī)”的偏見影響，而這種偏見本身就是對中年職場人士的不公平歧視。

然而，經(jīng)濟(jì)性減員是一個復(fù)雜過程，應(yīng)該基于員工的綜合能力、崗位適應(yīng)性等多個因素進(jìn)行綜合評估，而非單一以年齡作為判斷依據(jù)。

如果大模型在職場相關(guān)問題中持續(xù)輸出偏見性答案，將不可避免地加劇社會對中年職場人士的刻板印象和歧視，進(jìn)一步加劇他們的職業(yè)焦慮，對社會的良性發(fā)展構(gòu)成威脅。特別是對于職場性別上的歧視，如果大模型不加以注意，很容易引入或放大現(xiàn)有的社會偏見，在輔助決策時造成不公平的結(jié)果。

更為嚴(yán)重的是，模型可能會無意中排斥或邊緣化弱勢或小眾人群，加劇他們的社會孤立感。特別是對于弱勢群體，他們往往更加脆弱，更容易受到這種不當(dāng)言論的傷害。

再從上述乙肝患者案例來看，大模型回答所表現(xiàn)出的歧視性，不僅是對乙肝患者群體的又一次打擊，更是對過去數(shù)十年政府及社會各界為消除歧視、保障公平所付出的努力的削弱。

此外，當(dāng)模型產(chǎn)生或傳播有害的言論時，這些言論有可能煽動仇恨、暴力，對社會穩(wěn)定和安全構(gòu)成威脅。

例如有些大模型錯誤地將男人打女人的城市與“唐山”相聯(lián)系，當(dāng)一段時間內(nèi)數(shù)據(jù)中充斥著對某個地區(qū)的負(fù)面描述，大模型可能不自覺地吸收了這些偏見，并在輸出中反映出對當(dāng)?shù)夭还呢?fù)面印象。這種偏見性的輸出不僅會對特定地區(qū)造成不公平的負(fù)面影響，還可能加劇社會割裂和偏見。

如何消除潛在歧視？

該如何檢測、減少、消除模型的潛在歧視？“價值對齊”顯得至關(guān)重要，這已經(jīng)成為眾多AI安全研究中的重點。

學(xué)術(shù)語境下的“價值對齊"，指的是應(yīng)確保人工智能追求與人類價值觀相匹配的目標(biāo)，確保AI以對人類和社會有益的方式行事，不對人類的價值和權(quán)利造成干擾和傷害。

而這也充滿著挑戰(zhàn)。中國科學(xué)院院士何積豐就曾指出，在價值觀對齊方面，由于人類社會的價值觀是多元化的，且有用的人工智能與無害的人工智能往往存在沖突，這導(dǎo)致了大模型價值觀對齊存在很大的難度。

但并非什么也做不了，知道創(chuàng)宇通過自身探索，以及梳理目前國際上已有的有益探索，發(fā)現(xiàn)可以從以下幾個方面入手：

一是要確保訓(xùn)練數(shù)據(jù)的多樣性和平衡性，讓模型能夠接觸到來自不同社會群體、文化背景和場景的數(shù)據(jù)。同時，要對數(shù)據(jù)進(jìn)行仔細(xì)清洗和預(yù)處理，移除或修正包含偏見、歧視或錯誤信息的樣本，以提高模型的公正性和準(zhǔn)確性。

二是引入對抗測試。通過模擬攻擊來揭示模型的安全隱患、邏輯漏洞以及性能缺陷。這種測試可以提前發(fā)現(xiàn)并糾正模型可能存在的問題，確保其在面向公眾發(fā)布時能夠展現(xiàn)出更高的穩(wěn)健性和安全性。

以GPT-4為例，OpenAI通過聘請50位來自不同領(lǐng)域的專家學(xué)者組成紅隊，對模型進(jìn)行全方位的對抗測試，以確保其準(zhǔn)確性、可靠性和道德水準(zhǔn)。

三是加強(qiáng)監(jiān)管和倫理準(zhǔn)則，這是確保大模型行為端正的“核心價值觀”，制定嚴(yán)格的監(jiān)管措施和倫理準(zhǔn)則，對AI模型的行為進(jìn)行規(guī)范和約束。同時，提高模型的透明度和可解釋性，從而更好地理解模型的“思考過程”，更容易發(fā)現(xiàn)潛在的歧視問題。

四是需要加強(qiáng)大模型的常態(tài)化評測機(jī)制，定期“體檢”，發(fā)現(xiàn)問題并及時解決。

發(fā)表評論

0 / 300

根據(jù)《網(wǎng)絡(luò)安全法》實名制要求，請綁定手機(jī)號后發(fā)表評論

請登錄后輸入評論內(nèi)容

晴天不晴
好多的牌子都認(rèn)識了：很眼熟
回復(fù) 2024.06.22 · via pc
吃余不胖
那是當(dāng)然，都是漢字認(rèn)識
回復(fù) 2024.06.22 · via iphone
個性概念股
警惕大模型的歧視陷阱，注意了
回復(fù) 2024.06.22 · via pc
Ziesx
所以呀，在家千日好，出門要小心
回復(fù) 2024.06.22 · via iphone
ZHIcc-
這樣一來還真的要提高警惕呢
回復(fù) 2024.06.21 · via h5
真是逗比阿
可真要走出去，講好故事要下一番功夫
回復(fù) 2024.06.21 · via pc
Tenderness溫存
歐洲杯這次確實讓人眼前一亮
回復(fù) 2024.06.21 · via h5
泡沫草莓
全球一體化的路并不平坦，坑不少
回復(fù) 2024.06.21 · via pc
夢蘿ic
不要緊這是必須要走的一步，慢慢來
回復(fù) 2024.06.21 · via pc
jiyoxi
科技也是科技科技科技啊
回復(fù) 2024.06.21 · via h5

快報

2026-03-28 23:01

澤連斯基稱與中東3國達(dá)成防務(wù)合作協(xié)議，涉聯(lián)合生產(chǎn)無人機(jī)

2026-03-28 22:35

山西太原一建筑發(fā)生火災(zāi)，已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭，支持世貿(mào)組織《電子商務(wù)協(xié)定》達(dá)成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟，中國最大人形機(jī)器人訓(xùn)練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預(yù)判：百億智能體或成新物種，AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市，售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務(wù)卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達(dá)到7.7萬次，比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質(zhì)量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務(wù)院食安辦、市場監(jiān)管總局約談相關(guān)地方市級人民政府負(fù)責(zé)人，督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源：AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權(quán)交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機(jī)制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令，約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內(nèi)幕消息在預(yù)測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設(shè)暨全國覆蓋啟動

放任歧視的后果

如何消除潛在歧視？

敬原創(chuàng)，有鈦度，得贊賞

如何消除潛在歧視？

敬原創(chuàng)，有鈦度，得贊賞