阿里萬相視覺生成大模型正式開源
鈦媒體App 2月25日消息,阿里云旗下視覺生成基座模型萬相2.1(Wan)正式開源,此次開源采用最寬松的Apache2.0協議,14B和1.3B兩個參數規(guī)格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務。
據介紹,14B萬相模型在指令遵循、復雜運動生成、物理建模、文字視頻生成等方面表現突出,在權威評測集VBench中,萬相2.1以總分86.22%的成績大幅超越Sora、Luma、Pika等國內外模型,穩(wěn)居榜首。1.3B版本測試結果超過了更大尺寸的開源模型,甚至還接近部分閉源模型,同時能在消費級顯卡運行,僅需8.2GB顯存就可以生成高質量視頻,適用于二次模型開發(fā)和學術研究。
本文內容僅供參考,不構成投資建議,請謹慎對待。
根據《網絡安全法》實名制要求,請綁定手機號后發(fā)表評論