中國電信成為大模型領域一股重要力量。在2023數(shù)字科技生態(tài)大會上,中國電信展現(xiàn)了從液冷數(shù)據(jù)中心到智算平臺,從基礎大模型到行業(yè)大模型的全面布局,“網(wǎng)絡+云計算+AI+應用”成為中國電信的數(shù)字化標簽。
7月初世界人工智能大會上,中國電信發(fā)布了百億參數(shù)的星辰語義模型,中中國電信人工智能科技有限公司總經(jīng)理何忠江表示,中國電信在進行商業(yè)化落地過程中碰到了三個主要問題,幻覺問題、外推窗口問題以及多輪邏輯推理問題。
本次中國電信發(fā)布的星辰千億參數(shù)語義大模型,一定程度緩解如上問題。例如針對幻覺問題,中國電信通過數(shù)據(jù)切片溯源的機制,將一個復雜邏輯問題拆解為多輪邏輯相對簡單,數(shù)據(jù)可溯源的小問題來進行SFT訓練,在千億參數(shù)規(guī)模下,自測幻覺率能夠降低一半左右。接下來中國電信將通過量化蒸餾的手段,讓模型能夠低成本商用。
![]()
值得關注的是,中國電信的AI團隊宣布了開源開放的時間表,將于今年年底之前開源百億參數(shù)模型,明年4月開源千億參數(shù)模型,所有底層代碼都會開源。同步將開放超過1T的高質(zhì)量清洗數(shù)據(jù),以及各種基于星辰大模型底座的工具鏈,滿足各類開放用戶需求,并面向開發(fā)者提供各類大模型工具支持。
此外,中國電信研發(fā)的多模態(tài)大模型主要聚焦在提升圖文生成、圖文理解的能力,中國電信訓練了超過12億的各種風格數(shù)據(jù),目前支持寫實、彩墨畫、賽博朋克等接近20種繪畫風格,由于在訓練中特意加強了語義和圖像映射的attention學習,所以對于中文的理解,語義的細粒度理解提升不少。
人工智能領域除了算力和算法,核心環(huán)節(jié)還有數(shù)據(jù)。一是支撐大模型數(shù)據(jù)語料的積累,中國電信目前已經(jīng)完成了超500TB文本數(shù)據(jù)、12億張圖文數(shù)據(jù)、日采集2PB的視頻數(shù)據(jù)的積累,并且中國電信作為首家運營商單位加入中國大模型語料數(shù)據(jù)聯(lián)盟。
二是參與建設數(shù)據(jù)要素市場化,中國電信通過建設開放共享的隱私計算平臺,吸引合作數(shù)據(jù)和技術伙伴入駐。目前在海南,已協(xié)助市政府構建了“數(shù)據(jù)超市產(chǎn)品”,中國電信作為獨家運營方,促成了2000億的數(shù)據(jù)資源匯聚,運營了超5億的交易項目。
基于基礎大模型,中國電信進一步展現(xiàn)了行業(yè)大模型布局。中國電信政企信息服務事業(yè)群總經(jīng)理潘天舒介紹,中國電信首批試商用12個行業(yè)大模型,包括星辰教育大模型、治理大模型、政務服務大模型、應急大模型、醫(yī)保大模型、交通大模型、住建大模型、金融大模型、神農(nóng)一號大模型、出行大模型、旅游導覽大模型、礦山大模型。
以星辰教育大模型為例,中國電信基于教育行業(yè)億級服務數(shù)據(jù)沉淀,訓練出具有國家中英文作文特級教師水平的“精準教學大模型”,15秒就能完成一篇中英文作文的打分、點評和改進建議讓每一個學生每一篇作文都能享受到特級教師的輔導,教師一場考試作文評分與點評時間由4個小時縮短至30分鐘。目前已在河南1.2萬師生教學中應用并取得良好的效果。
再如星辰基層治理大模型,主要支撐三大場景:一是矛調(diào)助手,14種矛調(diào)手段智能匹配,讓基層調(diào)解員、尤其是新手在遇到疑難時能迅速獲得支持,調(diào)解成功率提升2倍以上;
二是法律明白人,為每一名基層調(diào)解員配備了一個“線上法律顧問”;
三是公文助手,支持7大類公文智能輸出,只需10分鐘即可完成原先1小時的公文報告;目前已在福州多個基層社區(qū)上線應用。
此外,中國電信還推出“星辰MaaS生態(tài)服務平臺”,為不同客戶提供專屬定制版、通用行業(yè)版和客戶自訓練版等三種大模型一站式服務。同時在全國首創(chuàng)推出“智能算力車”,采用“基礎算力+輕量版天翼云驍平臺+專用電源車”模式,滿足了部分客戶數(shù)據(jù)安全管理的規(guī)定,已在雄安新區(qū)等為客戶完成了定制訓練
大模型不斷擴大的參數(shù)規(guī)模和快速迭代的技術路線,跨越式地提升了模型的能力,但是同時也為大模型的訓練和應用帶來了很多挑戰(zhàn)。比如算力利用率的瓶頸日益凸顯、算力成本壓力進一步增大、模型的構建難度不斷提升,模型的行業(yè)落地更加復雜。
天翼云公司總經(jīng)理胡志強表示,大模型對于云服務商提出了新要求,天翼云也全面升級,構建了全棧大模型智算服務,包括打造智算數(shù)據(jù)中心AIDC、升級云智超一體化基礎設施平臺“云驍”、推出一站式智算服務平臺“慧聚”,構建國云大模型生態(tài),形成云智一體的智算服務體系。
智算基礎設施是整個體系的基石,針對AI高強度運算帶來的散熱問題,天翼云推出了液冷DC艙,融合定制化液冷智算服務器,實現(xiàn)低至1.12的PUE。
“云驍”升級成為云智超一體化基礎設施服務平臺,構建了高性能RoCE網(wǎng)絡、并行文件存儲等服務,重點提升訓練加速、網(wǎng)絡加速等核心能力,同時升級了運維體系,實現(xiàn)對基礎設施的全面故障預測和感知。
在國產(chǎn)化方面,云驍平臺率先在公有云加載天翼云RoCE網(wǎng)絡+國產(chǎn)GPU方案并實現(xiàn)商用。
![]()
在平臺層,天翼云全新發(fā)布大模型一站式智算服務平臺“慧聚”,構建一站式全鏈路的大模型生產(chǎn)應用的流水線,能夠大幅降低大模型訓練、微調(diào)、部署、推理的門檻,讓客戶能夠更專注于模型升級和應用落地。
據(jù)了解,慧聚平臺成功突破了算子加速、模型并行、斷點續(xù)訓等技術難點,將高性能計算能力、分布式算力調(diào)度能力、訓練和推理多環(huán)節(jié)加速技術、高性能數(shù)據(jù)存儲技術進行封裝;實現(xiàn)了萬卡集群調(diào)度,穩(wěn)定性、訓練推理速度等核心指標大幅提升。
慧聚平臺內(nèi)置數(shù)據(jù)平臺、模型訓練平臺、模型服務平臺和應用服務平臺四大平臺,提供數(shù)據(jù)準備、模型開發(fā)、任務管理、模型優(yōu)化等七大主要產(chǎn)品功能模塊,每個功能模塊又包含多級組件,功能與組件之間可以靈活組裝,幫助用戶打造針對不同場景的專屬工具集。
目前,中國是唯一在超導量子和光量子兩種物理體系上都實現(xiàn)“量子計算優(yōu)越性”的國家。如何將這些科研成果落地到實際場景中,推動科技變革、產(chǎn)業(yè)革命,在未來10年,量子計算云平臺、超量融合將是量子計算走向?qū)嵱没闹髁餍问健?/p>
中電信量子信息科技集團有限公司總經(jīng)理呂品介紹,中國電信的“天衍”量子計算云平臺,實現(xiàn)了“天翼云”超算算力和176個超導量子比特算力的融合,是具備“量子優(yōu)越性”能力的超量融合云平臺。
云平臺基于超量混合云架構,提供量子云操作系統(tǒng)、量子計算編譯、量子計算模擬、圖形化編程等核心能力,實現(xiàn)了超算和量子計算在云上混合調(diào)度,降低了量子計算機的使用門檻。這將加速量子計算助力量子化學研究、新藥新材料開發(fā)、能源氣象模擬等場景,對推動量子計算走向?qū)嵱没兄匾囊饬x。
呂品表示,天衍具備四大核心優(yōu)勢:首先,“天衍”平臺對接的超導量子計算機,在處理隨機線路取樣等特定問題上,速度比目前最快的超算快1000萬倍,真正實現(xiàn)了量子計算優(yōu)越性;
其次,這是一款完全自主可控的量子云平臺,實現(xiàn)了從真機到操控系統(tǒng)到編譯軟件全部國產(chǎn)化;
第三,量子計算未來有望在應用場景模擬上指數(shù)級提升計算速率,實現(xiàn)超量協(xié)同;
第四,中國電信攜手超過兩千家天翼云生態(tài)合作伙伴和20家量子計算生態(tài)伙伴,打造量子計算生態(tài)聯(lián)盟,共同推進量子科技的發(fā)展。
據(jù)悉,中國電信將持續(xù)致力于量子計算云平臺的性能提升,到2025年,接入不低于五百量子比特的量子計算機;到2030年,平臺將對接不低于1萬量子比特的超級量子計算機。
(本文首發(fā)鈦媒體APP 作者|張帥,歡迎添加作者mr3right交流)
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論
這背后找的誰合作呢?蹭熱點運營商從沒輸過
弄這么多有啥用?
不如把話費流量寬帶費降一降
這個奇元大模型聽起來不錯啊,備案360自研的兩大模型都獲得了批準,這可是個好消息。
這些大模型產(chǎn)品,不都是為了給企業(yè)提供服務嗎?怎么就有區(qū)別了呢?你說的平臺化、行業(yè)化的發(fā)展方向,我可不太懂。