近期,生成式人工智能(AIGC)領(lǐng)域又涌現(xiàn)出多款創(chuàng)意十足的新應(yīng)用。
今天,鈦媒體AGI梳理了免費 AI “神器”系列第十二彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對AI的想象力。
產(chǎn)品信息:AniPortrait是騰訊推出的一個創(chuàng)新技術(shù)框架,可以通過一張人臉照片和音頻生成一段高質(zhì)量視頻。與此前阿里發(fā)布的視頻生成模型EMO的功能相似,但AniPortrait是開源模型,用戶可以直接使用。
產(chǎn)品功能:AniPortrait可根據(jù)輸入的音頻和圖像生成會說話、唱歌的動態(tài)視頻,并保持人物面部表情流暢、生動且口型一致。同時支持多種語言輸入,還可以對面部重繪以及進行頭部姿勢控制。

據(jù)了解,該技術(shù)框架的工作原理分為兩個步驟:第一步AniPortrait會從音頻中提取關(guān)鍵信息,再將音頻通過兩個簡單的處理層轉(zhuǎn)換成一個三維的面部模型,并確定頭部姿勢。第二步,將三維面部模型和頭部姿態(tài)轉(zhuǎn)換成一系列二維點,進行識別標注,再使用Stable Diffusion 1.5結(jié)合時間運動模塊,根據(jù)二維標記點序列創(chuàng)建一系列連貫的肖像幀,形成動畫,確保動畫的流暢性和真實感。
但AniPortrait目前還存在對口型不太流暢自然的問題, 開發(fā)團隊強調(diào),接下來也會效仿阿里巴巴EMO(Emote Portrait Alive)的方法,直接從音頻來預(yù)測肖像視頻的生成,以達到更好的效果。
項目地址:https://huggingface.co/ZJYang/AniPortrait
論文地址:https://huggingface.co/papers/2403.17694
產(chǎn)品信息:Gauth是字節(jié)跳動在海外推出的AI教育應(yīng)用,產(chǎn)品定位為“AI學(xué)習(xí)陪伴”、“AI作業(yè)&學(xué)習(xí)幫手”,旨在幫助力提升教育及學(xué)習(xí)效率。
產(chǎn)品功能:用戶只需上傳題目照片,或者直接對題目拍照,Gauth就能在幾秒鐘的時間內(nèi)為用戶生成完整詳細的解題邏輯和解答步驟。
據(jù)悉,Gauth覆蓋的學(xué)科包括數(shù)學(xué)、統(tǒng)計學(xué)、物理、化學(xué)、歷史等。其中,網(wǎng)頁版Gauth還在“數(shù)學(xué)”模塊下劃分了多個細分方向包括方程,代數(shù),等式,不等式、序列、復(fù)數(shù)等,并有“統(tǒng)計”和“微積分”專屬模塊。根據(jù)測評,語文及綜合方面能力均可達到美國SAT考試水平,數(shù)學(xué)方面綜合答題水平可比美國9年級。
因具備強大的學(xué)習(xí)輔助功能,Gauth在海外市場爆火,據(jù)Gauth官網(wǎng)數(shù)據(jù)顯示,截至目前已有超過2億的學(xué)生用戶群體體驗并采用了該平臺的服務(wù)。從七麥數(shù)據(jù)榜單來看,截至2024年3月27日,Gauth在美國教育應(yīng)用市場中排名第二,僅次于全球知名語言學(xué)習(xí)應(yīng)用Duolingo(多鄰國)。
日活方面,Gauth近期全球日活用戶峰值達206.5萬人次,相較于1月25日的日活85.68萬人,增長超過1.4倍;日下載量方面,2024年1月1日Gauth下載量為4840,3月21日下載量為6.93萬次,日下載量增長14倍。
產(chǎn)品信息:NoLang是Mavericks公司開發(fā)的一款文生視頻模型,可以通過文字直接轉(zhuǎn)換成解說視頻,幫助用戶更直觀獲取信息。
![]()
產(chǎn)品功能:用戶可以輸入包含文字、網(wǎng)頁鏈接及PDF文件等進行提問,NoLang能根據(jù)提問快速生成一段解說視頻。例如,當用戶輸入一段文字或一個網(wǎng)頁鏈接時,NoLang會首先對內(nèi)容進行總結(jié),再根據(jù)總結(jié)的內(nèi)容生成一個解答視頻,這一功能使得信息獲取更加直觀和生動。
同時,NoLang還具備強大的互動性,用戶可以對生成的視頻進行互動,通過追加問題來延續(xù)視頻內(nèi)容,形成一系列相關(guān)聯(lián)的視頻線程,便于深入理解和跟蹤信息。這一功能使得NoLang不僅是一個信息獲取工具,更是一個智能學(xué)習(xí)助手。
此外,NoLang還推出了Chrome擴展功能。安裝Chrome擴展后,用戶可以直接在瀏覽器中調(diào)用NoLang服務(wù),無需離開當前網(wǎng)頁,即可生成視頻。不過,目前NoLang僅支持日語和英語,其他地區(qū)的用戶可能使用不便。
體驗地址:http://no-lang.com
產(chǎn)品信息:MoneyPrinterTurbo是一款開源AI視頻生成模型,旨在幫助視頻創(chuàng)作者高效制作短視頻。
產(chǎn)品功能:用戶只需輸入內(nèi)容主題或幾個關(guān)鍵詞,就能自動生成一段包含文案、素材、字幕以及背景音樂的一分鐘高清短視頻。并且MoneyPrinterTurbo支持批量視頻生成,一次性可生成多個視頻供用戶選擇,提高工作效率。
![]()
同時,MoneyPrinterTurbo可生成包括豎屏(9:16,1080x1920)和橫屏(16:9,1920x1080)的多尺寸視頻,支持多語言輸入和多種模型接入,包括OpenAI、moonshot、Azure、gpt4free、one-api等。截止發(fā)稿,MoneyPrinterTurbo在Github上已累積2500顆星。
項目地址: https://github.com/harry0703/MoneyPrinterTurbo
產(chǎn)品信息:LTX Studio是一款由Lightricks推出的AI電影生成工具,旨在簡化視頻創(chuàng)作流程,提升影片制作效率,降低成本。據(jù)了解,Lightricks的首批測試名額于2024年3月27日發(fā)放。
產(chǎn)品功能:用戶只需輸入文字提示或創(chuàng)意想法,LTX Studio便會根據(jù)提示生成腳本和分鏡頭,同時提供了豐富的定制選項,如場景、風(fēng)格、角色等,還可以對鏡頭切換、角色、場景一致性、攝像機、燈光等進行可視化精準控制,使用戶能靈活調(diào)整并預(yù)覽影片效果。
![]()
此外,LTX Studio還具有換臉和修改功能,用戶只需上傳一張照片,就能輕松實現(xiàn)角色換臉。亦或者使用 @ 提及角色名稱即可添加、替換或刪除任何鏡頭中的任何角色。這一功能增強了用戶的創(chuàng)造力和自由度,為視頻和影視創(chuàng)作帶來更多想象空間和可能。
體驗地址:https://ltx.studio/
(本文首發(fā)于鈦媒體APP,作者|章橙,編輯|林志佳)
![]()
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論