近期,生成式人工智能(AIGC)領域又涌現(xiàn)出多款創(chuàng)意十足的新應用。

今天,鈦媒體AGI梳理了免費 AI “神器”系列第六彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對AI的想象力。

1、Stability AI三連發(fā):Stable Diffusion 3、Stable Video、Creative Upscaler

繼OpenAI發(fā)布的視頻生成模型Sora風靡全球之后,AI 文生圖和視頻領域競爭加速,行業(yè)“鼻祖”、生成式 AI 技術公司Stability AI 2月22日-23日連續(xù)推出三款新產(chǎn)品:Stable Diffusion 3、Stable Video、Creative Upscaler,迎戰(zhàn)Sora。

產(chǎn)品信息:首先,Stable Diffusion 3是目前全球最強大的文生圖模型,生圖質量有很大改進,支持多主題提示,參數(shù)量從 800M 到 8B 不等,支持手機、電腦等便攜式設備使用,大大降低AI大模型的使用門檻。

其次,Stable Video是基于Stable Video Diffusion技術推出的 AI 視頻生成平臺,支持生成高質量視頻,新增了鏡頭控制等功能,用戶可以通過該工具快速創(chuàng)建高質量的視頻內容,無需專業(yè)技能和復雜的軟件,隨時用 AI 生成視頻。

最后,Creative Upscaler是該公司新推出的 AI 圖像提升增強工具,可以將圖像升級到4k分辨率,并創(chuàng)造以前沒有的新細節(jié)等,從而賦予圖像新生命。

產(chǎn)品功能:Stable Diffusion 3與之前版本一致,采用了與Sora一樣的Diffusion Transformer架構,直接生成逼真的 AI 圖片,不過目前還沒有全面開放,權重也沒有公布。團隊提到,他們正在采取一些安全措施,防止不法分子濫用。想要嘗鮮的用戶可以通過https://stability.ai/stablediffusion3申請。

Stable Video支持基于 AI 的圖生視頻和文生視頻,比上一代升級優(yōu)化了畫面穩(wěn)定性、運動幅度、畫面細節(jié)處理等功能,以及新增鏡頭控制能力。如今,用戶可以將記憶轉化為動態(tài)影像,或通過文字創(chuàng)造全新的故事,可用于商業(yè)宣傳視頻、教學視頻、產(chǎn)品展示等更多場景。

Stable Video付費方面,公測期間,用戶每日登錄都有150的積分,可免費用來生成15個視頻,若用戶有制作大量視頻需求也可按需購買。目前主要有兩種付費標準:一是10美元購買500積分,可制作50個視頻,二是50美元購買3000積分,可制作300個視頻。

最后是Creative Upscaler應用工具。其擁有分辨率提升、細節(jié)創(chuàng)造、創(chuàng)造力調整、面向高質量轉換、原始圖像保留、生命注入等獨特的 AI 技術功能。與大多數(shù)同類 AI 產(chǎn)品不同,Creative Upscaler結合文本提示和圖像,能創(chuàng)造出原本不存在的新細節(jié),為圖像賦予新的生命和可能性。

體驗地址:https://www.stablevideo.com/

https://creator.nightcafe.studio/stability-ai-creative-upscaler

2、實時人臉互換直播工具——SwapStream

產(chǎn)品信息:SwapStream是一款基于 AI 與云技術的實時人臉互換直播工具,用戶無需下載,可直接通過瀏覽器實現(xiàn)人臉互換直播。

產(chǎn)品功能:SwapStream可將任意人臉實時互換到直播視頻中,同時支持多個直播平臺同步,還可添加自定義RTMP直播通道等。使用簡單、擴展性強,適用于各類直播場景,主要受眾人群包含需要進行人臉互換的直播、需要快速設置直播環(huán)境的用戶以及需要擴展直播范圍的主播等。

體驗地址:https://www.swapstream.ai/

3、跨模態(tài)大語言模型——AnyGPT

產(chǎn)品信息:AnyGPT是由復旦大學、上海人工智能實驗室等機構聯(lián)合推出的一款多模態(tài)大語言模型,該模型采用離散表示技術,通過在各模態(tài)輸入上進行離散標記,實現(xiàn)了多模態(tài)信息的統(tǒng)一處理。

產(chǎn)品功能:首先AnyGPT可進行任何模態(tài)的輸入和輸出,無論是文本、圖像、音頻或是視頻都支持輸入,并可生成任何模態(tài)的輸出。

其次,AnyGPT可進行多模態(tài)理解和生成,能從一個模態(tài)接收輸入并在另一個或多個模態(tài)中生成輸出。如它可以從文本生成音樂,從語音生成圖片等。

最后,AnyGPT可實現(xiàn)任意模態(tài)轉換,如將語音指令轉換成文本+圖片+音樂的響應,或將語音+音樂轉換成圖像+文本的響應。

項目及演示地址:https://junzhan2000.github.io/AnyGPT.github.io/

4、聲畫分離模型——PixelPlayer

產(chǎn)品信息:PixelPlayer 是一款聲畫分離模型,能通過分析大量未標記的視頻,識別視頻中哪些區(qū)域在產(chǎn)生聲音,并將聲音分離成代表每個像素聲音的組件。該模型由麻省理工學院計算機科學與人工智能實驗室開發(fā)。

產(chǎn)品功能:PixelPlayer 能處理和識別人們演奏不同樂器的視頻,并對單聲道音頻輸入進行音視頻源分離和定位,最終實現(xiàn)將聲音信號分割成多個通道,每個通道對應一個樂器類別,并能為視頻中的每個像素指定一個獨立的音頻波形。

在PixelPlayer開發(fā)團隊的演示視頻中,點擊視頻上的不同區(qū)域(對象:樂器或空氣),會發(fā)出不同的聲音。

在PixelPlayer開發(fā)團隊的演示視頻中,點擊視頻上的不同聲源區(qū)域,會發(fā)出不同的聲音。

PixelPlayer為音視頻編輯、多媒體內容制作、增強現(xiàn)實應用等領域提供了強大的工具,使得獨立調整視頻中不同聲音源音量、去除或增強特定聲音源等操作成為可能。截至發(fā)稿,PixelPlayer在Github上已累積351顆星。

體驗地址:http://sound-of-pixels.csail.mit.edu/

5、金融分析師的人工智能助手——Finpilot

產(chǎn)品信息:Finpilot是一款由西雅圖初創(chuàng)公司Finpilot推出、專門為金融分析師設計的 AI 助手應用,以生成式 AI 技術為核心,旨在協(xié)助金融分析師進行研究和解答金融問題。

產(chǎn)品功能:Finpilot可幫助分析師快速搜集和分析金融數(shù)據(jù),股票分析,編寫報告,以及進行數(shù)據(jù)可視化。同時,F(xiàn)inpilot提供可驗證的信息來源,保證數(shù)據(jù)研究質量。用戶只需與Finpilot對話,即可獲取對應的金融或財務數(shù)據(jù),從而簡化金融分析工作流程,大幅提高工作效率。

例如,通過問答,用戶可獲取阿里巴巴、騰訊、HAL等公司分部過去五年的收入數(shù)據(jù),以及比較SNOW、CRWD等多個公司凈留存率等。

另外,2月23日,F(xiàn)inpilot還官宣完成由Madrona領投的400萬美元的融資。Finpilot表示,本輪融資的資金主要用于擴大技術團隊和升級軟件功能,包括引入更先進的自然語言處理技術、提高ChatGPT在金融領域的應用和智能水平,以及部分用于市場推廣,以增強軟件在金融行業(yè)的影響力。

體驗地址:https://www.finpilotai.com/

(本文首發(fā)鈦媒體App,作者|章橙,編輯|林志佳)

 

本文系作者 章橙 授權鈦媒體發(fā)表,并經(jīng)鈦媒體編輯,轉載請注明出處、作者和本文鏈接。
本內容來源于鈦媒體鈦度號,文章內容僅供參考、交流、學習,不構成投資建議。
想和千萬鈦媒體用戶分享你的新奇觀點和發(fā)現(xiàn),點擊這里投稿 。創(chuàng)業(yè)或融資尋求報道,點擊這里。

敬原創(chuàng),有鈦度,得贊賞

贊賞支持
發(fā)表評論
0 / 300

根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論

登錄后輸入評論內容

快報

更多

2026-03-28 23:01

澤連斯基稱與中東3國達成防務合作協(xié)議,涉聯(lián)合生產(chǎn)無人機

2026-03-28 22:35

山西太原一建筑發(fā)生火災,已致1人死亡25人受傷

2026-03-28 22:26

王文濤部長發(fā)表書面致辭,支持世貿組織《電子商務協(xié)定》達成臨時實施安排

2026-03-28 21:54

40余家單位聯(lián)盟,中國最大人形機器人訓練基地在京揭牌

2026-03-28 21:41

周鴻祎與劉慈欣在科幻大會預判:百億智能體或成新物種,AI推動人類文明分化

2026-03-28 21:38

第五代宏光MINIEV上市,售價4.48萬-5.48萬元

2026-03-28 20:42

烏稱伊朗襲擊迪拜倉庫并致烏克蘭人傷亡消息不實

2026-03-28 20:23

3月28日新聞聯(lián)播速覽23條

2026-03-28 20:05

美國務卿和歐盟官員被曝就烏克蘭問題激烈交鋒

2026-03-28 19:44

“Token”這個詞的搜索量最高一天達到7.7萬次,比去年日均搜索量高出1850%

2026-03-28 19:39

飛捷科思發(fā)布中國首個可微分物理仿真引擎Fysics

2026-03-28 19:13

“網(wǎng)售產(chǎn)品質量安全提升系列行動2026”在北京啟動

2026-03-28 19:03

國務院食安辦、市場監(jiān)管總局約談相關地方市級人民政府負責人,督辦“3?15”晚會曝光問題整改

2026-03-28 18:44

飛書 CLI 開源:AI 可直連飛書辦公套件

2026-03-28 18:36

馬來西亞說伊朗允許馬滯留油輪通行霍爾木茲海峽

2026-03-28 18:02

今年前三個月中國創(chuàng)新藥對外授權交易總額超600億美元

2026-03-28 17:39

中國和菲律賓舉行南海問題雙邊磋商機制第十一次會議

2026-03-28 17:30

印尼正式實施16歲以下社媒禁令,約7000萬人受影響

2026-03-28 17:04

美國加州禁止官員借內幕消息在預測市場牟利

2026-03-28 17:02

北京“超現(xiàn)場”生態(tài)共同體建設暨全國覆蓋啟動

掃描下載App