鈦媒體App 3月27日消息,3月27日凌晨,
阿里巴巴發(fā)布并開源首個端到端全模態(tài)大模型通義千問Qwen2.5-Omni-7B,可同時處理文本、圖像、音頻和視頻等多種輸入,并實時生成文本與自然語音合成輸出。在權威的多模態(tài)融合任務OmniBench等測評中,Qwen2.5-Omni刷新業(yè)界紀錄,全維度遠超Google的Gemini-1.5-Pro等同類模型。Qwen2.5-Omni以接近人類的多感官方式立體認知世界并與之實時交互,還能通過音視頻識別情緒,在復雜任務中進行更智能、更自然的反饋與決策?,F(xiàn)在,開發(fā)者和企業(yè)可免費下載商用Qwen2.5-Omni,手機等終端智能硬件也可輕松部署運行。
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論