近期,生成式人工智能(AIGC)領(lǐng)域又涌現(xiàn)出多款創(chuàng)意十足的新應(yīng)用。
今天,鈦媒體AGI梳理了免費 AI “神器”系列第九彈,共五款,其中不少產(chǎn)品再一次拓寬了我們對AI的想象力。
產(chǎn)品信息:AnimateDiff-Lightning是字節(jié)跳動推出的文生視頻大模型,該模型是從AnimateDiff SD1.5v2中提煉出來的,包含了1步、2步、4步和8步提煉模型的版本。其中,2步、4步和8步模型的生成質(zhì)量非常好,為視頻創(chuàng)作者帶來更多了想象和助力。
![]()
產(chǎn)品功能:AnimateDiff-Lightning能夠根據(jù)文本描述生成視頻,比起原來的AnimateDiff模型,速度提升十倍以上。同時還可以與多種不同風(fēng)格的基礎(chǔ)模型結(jié)合使用,將現(xiàn)有視頻轉(zhuǎn)換成不同風(fēng)格的視頻。比如將現(xiàn)實風(fēng)格視頻轉(zhuǎn)換成動漫卡通風(fēng)格,以滿足不同視頻風(fēng)格創(chuàng)作需要。此外,AnimateDiff-Lightning支持多步驟蒸餾模型,提供1步、2步、4步和8步的蒸餾模型,用戶可以根據(jù)自己的需求,在生成視頻的速度和質(zhì)量之間做出選擇,以平衡生成速度和視頻質(zhì)量。
體驗地址:https://huggingface.co/ByteDance/AnimateDiff-Lightning?ref=top.aibase.com
論文地址: https://arxiv.org/html/2403.12706v1
產(chǎn)品信息:Animagine XL3.1是由海藝AI與Cagliostro Lab合作推出的一款開源動漫文生圖模型。相較于V3.0版本,Animagine XL 3.1在各方面都進(jìn)行顯著的技術(shù)性提升,使其對動漫作品和風(fēng)格的理解更加深入,為用戶提供更加強大的動漫圖像生成體驗。
產(chǎn)品功能:Animagine XL 3.1能夠根據(jù)文本提示生成高質(zhì)量動漫風(fēng)格圖像。為了提高生成結(jié)果的準(zhǔn)確性,Animagine XL3.1采用了標(biāo)簽排序的方式,可以更準(zhǔn)確地根據(jù)輸入的標(biāo)簽進(jìn)行生成圖像,提高生成結(jié)果準(zhǔn)確性。同時,Animagine XL 3.1擁有87萬張圖片的數(shù)據(jù)集,極大增強了模型對各種動漫角色的識別能力;引入全新概念“美學(xué)標(biāo)簽”,更新了質(zhì)量和年份標(biāo)簽,不僅提高了生成圖像的視覺吸引力,也確保圖像風(fēng)格一致性,符合更高要求的審美質(zhì)量標(biāo)準(zhǔn)。
![]()
此外,Animagine XL3.1還解決了3.0版本中的過曝問題,提高了生成圖像的質(zhì)量。通過對算法和訓(xùn)練過程的優(yōu)化,該模型在生成圖像時,能夠更好地控制圖像的亮度和色彩,從而避免過曝現(xiàn)象的出現(xiàn)。目前V3.0在Civitai的下載量超7萬。
體驗地址:https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1
模型下載地址:https://huggingface.co/cagliostrolab/animagine-xl-3.1?ref=top.aibase.com
產(chǎn)品信息:Optimizer AI是一款可以為視頻自動生成音效的AI工具,旨在提升游戲開發(fā)者、藝術(shù)家和視頻創(chuàng)作者工作效率,通過音效為視頻增添更多活力。
![]()
產(chǎn)品功能:首先,用戶輸入文字提示即可生成適用于視頻中各種場景的聲音和音效,包括游戲音效、動畫背景音和視頻配樂。用戶還可以通過指定風(fēng)格標(biāo)簽(如卡通、恐怖等)來引導(dǎo)生成不同風(fēng)格的聲音。
其次,Optimizer AI支持聲音效果生成,包括變聲功能,能夠基于一個參考聲音生成多個類似的聲音。
再次,Optimizer AI可以生成用于背景音樂或創(chuàng)建特定氛圍的聲音,并能夠處理和理解文本的信息,保持生成的一致性的同時還可以生成時長更長的聲音效果。
最后,即將推出的視頻到聲音全面生成功能將允許用戶從視頻中直接生成聲音效果,進(jìn)一步擴展聲音創(chuàng)作的可能性。
官網(wǎng)地址: https://www.optimizerai.xyz/
體驗地址: https://discord.com/invite/bgfnVaaU2n
產(chǎn)品信息: Paper Piano(紙鋼琴)是一款通過攝像頭追蹤就能實現(xiàn)在任何一張白紙上彈鋼琴的AI應(yīng)用。Paper Piano(紙鋼琴)的工作原理是通過在紙上預(yù)定義不同區(qū)域來代表鋼琴鍵,當(dāng)攝像頭捕捉到手指觸摸特定區(qū)域時,相應(yīng)的音符將被生成。

產(chǎn)品功能: 用戶只需準(zhǔn)備兩張A4大小的白紙模擬鋼琴鍵盤,Paper Piano(紙鋼琴)通過攝像頭跟蹤和手指識別技術(shù)捕捉用戶的手指移動,從而實現(xiàn)在紙上模擬鋼琴鍵按壓,奏出美妙音樂。值得注意的是,為了確保手指追蹤的準(zhǔn)確性,系統(tǒng)要求在網(wǎng)絡(luò)攝像頭的設(shè)置上注意角度、高度和距離,同時光線越強,性能也會越好。
不過,目前該項目尚處于支持最多兩根手指的階段,未來將支持更多手指和更高敏感度的訓(xùn)練模型,為用戶提供更豐富的演奏體驗。這一技術(shù)的發(fā)展可能帶來更多有趣的音樂應(yīng)用,使用戶無需購買真正的鋼琴即可享受演奏的樂趣。
體驗地址:https://github.com/Mayuresh1611/Paper-Piano?ref=top.aibase.com
產(chǎn)品信息:screenshot-to-code是一種基于人工智能技術(shù)的創(chuàng)新工具,旨在幫助開發(fā)人員將圖像或界面設(shè)計截圖轉(zhuǎn)換成可執(zhí)行的代碼。用戶只需上傳截圖,即可獲得整潔的網(wǎng)頁代碼,如HTML、Tailwind CSS和JavaScript等。

產(chǎn)品功能:首先是智能生成代碼,通過集成GPT-4Vision,該應(yīng)用程序能夠智能地分析截圖并生成相應(yīng)的HTML、Tailwind CSS和JavaScript代碼,提高用戶寫代碼效率。
其次是DALL-E3生成相似圖像,應(yīng)用程序不僅能生成代碼,還可以利用DALL-E3生成與原始截圖相似的圖像,增強用戶體驗。
最后是實時代碼更新,用戶可以直接在應(yīng)用程序中查看生成的代碼,并在需要時通過與AI互動指令,調(diào)整樣式或更新缺失的部分,以滿足其需求。
因其簡單、高效的圖轉(zhuǎn)代碼功能,screenshot-to-code深受開發(fā)者和設(shè)計者歡迎,截至發(fā)稿,該應(yīng)用在GitHub平臺已累計超35000顆星。
體驗地址:https://screenshottocode.com/
(本文首發(fā)于鈦媒體APP,作者|章橙,編輯|林志佳)
![]()
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論