圖片來(lái)自網(wǎng)易有道
3月10日,鈦媒體APP從網(wǎng)易有道獨(dú)家獲悉,有道翻譯大模型已經(jīng)實(shí)現(xiàn)底層技術(shù)迭代,基于自主研發(fā)的子曰翻譯大模型2.0,其中,14B小參數(shù)垂類(lèi)模型,實(shí)現(xiàn)了高水準(zhǔn)的翻譯性能,現(xiàn)在已經(jīng)全量上線。
14B小參數(shù)垂類(lèi)模型推出,意味著在訓(xùn)練和推理時(shí),AI翻譯消耗的計(jì)算資源更少,部署的成本更低,更容易集成到現(xiàn)有系統(tǒng)和設(shè)備中,適合更多的實(shí)際場(chǎng)景。
鈦媒體APP觀察到,搭載全新大模型的翻譯技術(shù),已在有道詞典、有道翻譯及有道翻譯官內(nèi)上線,提供標(biāo)準(zhǔn)模型和高級(jí)模型兩種不同參數(shù)的選擇,用戶(hù)可直接切換使用。
與此同時(shí),該大模型已經(jīng)上線網(wǎng)易有道旗下智能硬件產(chǎn)品,有道詞典筆X7系列已升級(jí)為最新的翻譯大模型,其余型號(hào)將陸續(xù)更新。
事實(shí)上,大語(yǔ)言模型的性能并非完全由參數(shù)量決定,很大程度上也依賴(lài)于數(shù)據(jù)質(zhì)量、領(lǐng)域適配性與算法優(yōu)化的結(jié)合。
鈦媒體APP了解到,網(wǎng)易有道之所以能夠?qū)崿F(xiàn)14B小參數(shù)垂類(lèi)模型,是因?yàn)?,在?shù)據(jù)層面,新的模型技術(shù)收集并清洗了高質(zhì)量的翻譯語(yǔ)料數(shù)據(jù),并由英語(yǔ)專(zhuān)業(yè)八級(jí)認(rèn)證人員及職業(yè)譯員進(jìn)行精細(xì)化人工標(biāo)注,使得模型擁有海量的優(yōu)質(zhì)數(shù)據(jù)資源庫(kù),增強(qiáng)其在多樣化翻譯場(chǎng)景的應(yīng)對(duì)能力。
而在算法層面,有道以子曰大模型為基礎(chǔ),進(jìn)行了二次預(yù)訓(xùn)練,打造了兼具專(zhuān)業(yè)性與針對(duì)性的翻譯基座大模型,結(jié)合大模型蒸餾技術(shù)、大模型融合技術(shù)和Online DPO(在線直接偏好優(yōu)化)技術(shù)等手段,避免了大模型的災(zāi)難性遺忘等問(wèn)題,并在運(yùn)行效率、準(zhǔn)確性、流暢性等翻譯性能上實(shí)現(xiàn)大幅提升。
最后是在評(píng)估層面,借助翻譯數(shù)據(jù)沉淀,有道研發(fā)了翻譯評(píng)估模型Reward Model,為子曰翻譯大模型的性能評(píng)估,提供一個(gè)可靠的量化依據(jù),以及完善的人工評(píng)估方案,多維度對(duì)模型的翻譯結(jié)果進(jìn)行評(píng)估和分析。
垂類(lèi)模型通過(guò)聚焦特定領(lǐng)域,在特定任務(wù)的優(yōu)化上,具備相對(duì)優(yōu)勢(shì)。在垂直場(chǎng)景上,子曰翻譯大模型2.0,在中英文互譯領(lǐng)域有所突破,譯文的專(zhuān)業(yè)度和穩(wěn)定性較前代版本均有提升。
此外,根據(jù)有道內(nèi)部測(cè)評(píng),新的翻譯模型在人文學(xué)科、商科、生活服務(wù)、醫(yī)療、科學(xué)等19個(gè)垂直領(lǐng)域的多學(xué)科的專(zhuān)業(yè)性、準(zhǔn)確性、語(yǔ)言慣例和風(fēng)格等方面,展現(xiàn)出了相比之前更高的翻譯準(zhǔn)確率和流暢度。
網(wǎng)易有道相關(guān)負(fù)責(zé)人對(duì)鈦媒體APP表示,“通用大模型比的是參數(shù)大和算力強(qiáng),但翻譯靠參數(shù)堆不出專(zhuān)業(yè)度。當(dāng)通用大模型競(jìng)逐參數(shù)規(guī)模時(shí),我們更相信垂類(lèi)模型的未來(lái)價(jià)值,用專(zhuān)業(yè)的垂直應(yīng)用真正解決專(zhuān)業(yè)場(chǎng)景的痛點(diǎn),也是我們持續(xù)努力的方向。”
大模型技術(shù)浪潮之前,有道翻譯技術(shù)主要基于統(tǒng)計(jì)機(jī)器翻譯及神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)(NMT)。
截至目前,有道全系翻譯產(chǎn)品擁有超10億用戶(hù)。Quest Mobile數(shù)據(jù)顯示,網(wǎng)易有道詞典月活躍用戶(hù)數(shù)已超過(guò)1億,自2019年起,已連續(xù)六年位居教育類(lèi)工具領(lǐng)域榜首。(本文獨(dú)家首發(fā)于鈦媒體APP,作者|李程程)
![]()
快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
多垂直領(lǐng)域提升,工作學(xué)習(xí)都方便。
有道翻譯用戶(hù)超10億,這影響力,出的模型肯定差不了。
這模型易集成,感覺(jué)好多軟件都能接入,超實(shí)用。
有道這模型,感覺(jué)能改變大家學(xué)外語(yǔ)的方式。
中英文翻譯提升大,和老外交流更順暢。
小參數(shù)卻有大作用,有道這模型太給力。
數(shù)據(jù)、算法助力,模型實(shí)力不容小覷。
靠多維度評(píng)估,模型質(zhì)量肯定杠杠的。
從研發(fā)到上線,網(wǎng)易有道效率真高。
模型上線,趕緊去有道產(chǎn)品體驗(yàn)一下