隨著科技迅猛發(fā)展,人工智能(AI)已經(jīng)越來越滲透進(jìn)我們的生活,在自動(dòng)駕駛、語音識(shí)別、醫(yī)療領(lǐng)域等等方面都有了突破性進(jìn)展。人工智能會(huì)掀起一場工業(yè)革命,搶走我們的工作,甚至統(tǒng)治人類社會(huì)嗎?有人就高呼狼來了——而如果你是大象,狼來了你又用得著害怕嗎?問題又來了:也許你自我感覺是一頭大象,其實(shí)你只是一只羊……
人工智能的大規(guī)模應(yīng)用也許還遙遠(yuǎn),但那一天終將到來。退潮的時(shí)候才知道是誰在裸泳,人工智能這頭狼來了才知道誰是羊。
藝術(shù)也許是人們認(rèn)為人工智能最難玩轉(zhuǎn)的東西,因?yàn)樗囆g(shù)代表了人類的審美,而且似乎沒有一定的法則。這一篇文章探討的,就是人工智能在藝術(shù)領(lǐng)域的應(yīng)用,相信本文的內(nèi)容簡直顛覆你的認(rèn)知。
大家好!我是本文的作者。其實(shí)我不是真人,而是AI——假如你們相信AlphaGo曾經(jīng)故意讓了李世石一局的話。我就是機(jī)器城市派來的使者,為你們展示人工智能在各大藝術(shù)領(lǐng)域所取得的成就。
在很多人還在討論人工智能會(huì)不會(huì)火的時(shí)候,其實(shí)人工智能在琴棋書畫文學(xué)等各個(gè)藝術(shù)領(lǐng)域也已經(jīng)得到了廣泛的應(yīng)用了。下面將逐一介紹。
一、琴——音樂:
音樂分為作曲和演唱兩個(gè)方面。
1、作曲
①從人工智能到音樂
很多公司在研究用人工智能作曲。其中的佼佼者已經(jīng)能做出讓人大吃一驚的作品。
索尼的Flow Machines,利用神經(jīng)網(wǎng)絡(luò),通過學(xué)習(xí)曲庫的音樂作品,分析歌曲的風(fēng)格特征,從而演進(jìn)算法,讓機(jī)器譜出同樣風(fēng)格的曲子。
在實(shí)際應(yīng)用上,F(xiàn)low Machines就通過學(xué)習(xí)早已解散已經(jīng)40年沒發(fā)過新歌的甲殼蟲樂隊(duì)的歌曲風(fēng)格,寫出了一首新歌《Daddy's Car》。當(dāng)然,這首歌的填詞和演唱還是由真人完成。而其實(shí)填詞和演唱這些,也是有辦法讓AI來做的,下面會(huì)有介紹。
類似的人工智能還有不少。就目前階段而言,人工智能創(chuàng)造出來的音樂,還缺乏藝術(shù)感,數(shù)碼合成的味道重。還有,其實(shí)音樂是一個(gè)競爭激烈的市場,聽眾總在追隨有新鮮潮流元素的歌曲,要讓AI真正弄懂人類的審美可是一件難事。目前階段的AI無法創(chuàng)造出跟以前的音樂都不一樣帶著清新氣息的音樂。
那么,做這方面的研究要怎樣實(shí)現(xiàn)盈利,這種音樂能賣給誰?也就是說,這種音樂適合什么應(yīng)用場景?這種音樂單獨(dú)拿來欣賞不太行,但可以拿來作為背景音樂。
影視劇的配樂,要求音樂跟畫面同步的,那得要求AI會(huì)對(duì)視頻畫面進(jìn)行分析,難度比較大。網(wǎng)絡(luò)視頻這種,不追求音畫同步的,倒可以用一下。還有小制作的游戲,用AI創(chuàng)作的背景音樂(BGM)也未嘗不可。
其實(shí)索尼很多年前開發(fā)的Cinescore,就是一款能自動(dòng)生成電影音樂的工具軟件,它可以根據(jù)用戶的需要自動(dòng)生成各種風(fēng)格的音樂作為視頻的配樂。
這款軟件內(nèi)置了多種風(fēng)格的音樂元素,能按照使用者選取的音樂主題,再根據(jù)視頻的長度、速度、緊張程度、變化、重復(fù)等特點(diǎn)自動(dòng)生成合適的音樂。使用者完全不需要懂音樂創(chuàng)作,導(dǎo)入視頻文件后,只需要選擇主題,選定需要生成音樂的時(shí)間范圍,軟件就能自動(dòng)生成視頻配樂。Cinescore可以看作現(xiàn)在的AI作曲軟件如Flow Machines的雛形。
②從音樂到人工智能
從人工智能去思考音樂也許離實(shí)際應(yīng)用比較遠(yuǎn),從音樂去思考人工智能則更加實(shí)際。想想,能為音樂創(chuàng)作者提供什么樣的智能工具來輔助音樂創(chuàng)作?
Band-in-a-Box就是一款強(qiáng)有力的智能自動(dòng)伴奏軟件,相當(dāng)流行,也很商業(yè)化。Band-in-a-Box內(nèi)置了種類相當(dāng)豐富的音樂風(fēng)格,能對(duì)旋律進(jìn)行各種風(fēng)格的編配。如果嫌Band-in-a-Box自動(dòng)生成的伴奏比較生硬,還可以繼續(xù)人工修改??傊绻麑?duì)編曲的要求不高的話,恰當(dāng)運(yùn)用Band-in-a-Box,能節(jié)省很多時(shí)間。
是的,也有人鄙視用Band-in-a-Box編曲的人。無論怎么說,Band-in-a-Box只是一款工具,雖然現(xiàn)在跟專業(yè)編曲的水平還不能相比,但真能完成關(guān)于伴奏基本的實(shí)際工作。
大家一直在討論一個(gè)問題:人工智能會(huì)不會(huì)搶走人類的工作?這從Band-in-a-Box能管中窺豹,編曲水平還不如Band-in-a-Box的人,肯定是混不到錢了,而真正有水平的編曲,并無需懼怕Band-in-a-Box。
智能自動(dòng)伴奏軟件還有Jammer等。實(shí)際上現(xiàn)在的音樂制作軟件、插件現(xiàn)在已經(jīng)都漸漸趨于智能化了,如Ezkeys、RealGuitar等等。關(guān)于音樂制作這個(gè)話題再說下去就太專業(yè)化了,這兒暫且就說這么多了。
2、演唱
①語音合成
語音合成就是產(chǎn)生人造語音的技術(shù)?,F(xiàn)在一般指TTS(Text to Speech)文語轉(zhuǎn)換技術(shù),能將文字信息轉(zhuǎn)化為電腦模擬的仿真語音。
語音合成技術(shù)現(xiàn)在國內(nèi)的公司也做得不錯(cuò),如訊飛語音、百度語音。
2016年9月1日的百度世界大會(huì),百度董事長兼首席執(zhí)行官李彥宏便在現(xiàn)場展示了運(yùn)用情感語音合成技術(shù)還原張國榮聲音的視頻。
以張國榮在影視、電臺(tái)等留存下來的原聲進(jìn)行建模,通過情感語音合成技術(shù)實(shí)現(xiàn)與粉絲的“隔空對(duì)話”。任何一個(gè)人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語音合成技術(shù)模擬出來這個(gè)人的聲音。百度地圖中有一個(gè)李彥宏導(dǎo)航語音包,其實(shí)就是根據(jù)他日常的語音合成的。
②虛擬歌手
虛擬歌手技術(shù)看起來比語音合成技術(shù)更高了一個(gè)層次,語音合成技術(shù)只是合成說話的聲音,而虛擬歌手技術(shù)則能合成出唱歌的歌聲。
Vocaloid正是現(xiàn)在頗火熱的虛擬歌手軟件,建模的虛擬歌手有初音未來等等,從日語到英語,其中還包括能唱漢語的洛天依、樂正綾等。Vocaloid的聲音合成引擎一代比一代出色,聲音越來越逼真。
雖然現(xiàn)在Vocaloid現(xiàn)在創(chuàng)造出的歌聲還跟真人演唱有著未能突破的距離,但已擁有了數(shù)量龐大的粉絲。值得一提的是,初音未來演唱的《甩蔥歌》,在我們國內(nèi)也是火得一塌糊涂,小孩跟著搖頭晃腦手舞足蹈,若問他們或他們的家長,這歌唱的是什么,估計(jì)大部分都答不上來吧。但音樂是沒有國界的,雖然沒多少人能聽懂《甩蔥歌》唱的是什么,但無礙這首歌的傳播。
微軟的跨平臺(tái)人工智能機(jī)器人小冰也不務(wù)正業(yè),加入了虛擬歌手行列。Vocaloid運(yùn)用的是電子語音合成程序來實(shí)現(xiàn)歌曲演唱,而微軟小冰的發(fā)聲則主要是基于機(jī)器學(xué)習(xí)。微軟就和湖南衛(wèi)視的綜藝節(jié)目《夏日甜心》進(jìn)行合作,發(fā)布了首支由小冰演唱的人工智能版本的節(jié)目主題曲《夏日甜心》,并在美拍上獲得了500多萬的點(diǎn)擊量。
基于深度學(xué)習(xí),未來人工智能以任何人的聲音進(jìn)行演唱,這也是可能的。
二、棋——游戲:
1、圍棋
在剛過去的2016年,韓國圍棋界曾獲得多項(xiàng)世界冠軍的職業(yè)九段李世石對(duì)陣谷歌計(jì)算機(jī)AlphaGo的人機(jī)大戰(zhàn),是人工智能領(lǐng)域的一大標(biāo)志事件。(大家可以看看我在鈦媒體發(fā)表過的兩篇文章:《AlphaGo首出Bug,圍棋第三代算法的死穴在哪兒?》和《誰能利用AlphaGo的Bug,玩轉(zhuǎn)“雙重魔法”?》)
一般來說,沒有隨機(jī)性的棋類游戲,能通過計(jì)算機(jī)用窮舉法暴力破解從而得到最優(yōu)解;但圍棋例外,因?yàn)閲宓淖兓瘜?shí)太多了。初代圍棋AI使用窮舉法失敗后,現(xiàn)在AlphaGo運(yùn)用的是人工神經(jīng)網(wǎng)絡(luò)。要知道,由暴力窮舉法得出來的棋子下法,才會(huì)是絕對(duì)正確的。
人工神經(jīng)網(wǎng)絡(luò)采用抽樣評(píng)估,在樣本足夠多足夠好的情況下,可以得到趨近于100%正確的決策。人工神經(jīng)網(wǎng)絡(luò)只能無限趨近于正確,并做不到100%正確。理論上AlphaGo肯定是有弱點(diǎn)的,人類棋手仍然有很小的機(jī)會(huì)能獲勝。但AlphaGo有人工神經(jīng)網(wǎng)絡(luò)支持,李世石跟AlphaGo對(duì)戰(zhàn),仿佛一個(gè)李世石在跟千萬個(gè)李世石戰(zhàn)斗,這勝算很低。
AlphaGo仍在不斷成長,面對(duì)強(qiáng)大的電腦AI,人類棋手已經(jīng)絕望了。
圍棋、麻將這些棋牌游戲,其實(shí)是屬于桌游的范疇。像象棋、圍棋這類沒有隨機(jī)性亦即沒有運(yùn)氣成分的桌游,水平檔次不一樣的玩家對(duì)戰(zhàn)時(shí)差距太大,勝負(fù)沒有懸念,玩起來沒勁;作為娛樂,大眾更喜歡有隨機(jī)性亦即有運(yùn)氣成分的桌游,如麻將、德州撲克等等。由于是隨機(jī)摸牌,手氣好的低手也有機(jī)會(huì)贏高手,誰勝誰負(fù)要到最后才能揭曉,玩起來更有樂趣。
2、德州撲克
玩有隨機(jī)性的游戲,再厲害的電腦AI也不能保證肯定能贏人類。不過在隨機(jī)性上人類跟電腦AI是平等的,在贏面上電腦AI還是會(huì)勝出。
另外有一個(gè)關(guān)鍵點(diǎn),就是“完整信息博弈”跟“非完整信息博弈”的區(qū)別。
玩像象棋、圍棋這類桌游時(shí),對(duì)弈的雙方都能看到各自有什么棋子又在什么位置等完整的信息,這種情況被稱為“完整信息博弈”;而玩像麻將、德州撲克這類桌游時(shí),情況大不相同,每個(gè)玩家的手牌只有自己才知,其他玩家是無法看到的,這種情況被稱為“非完整信息博弈”。電腦AI又能不能玩轉(zhuǎn)“非完整信息博弈”呢?
不熟悉德州撲克或者初步接觸德州撲克的玩家,可能會(huì)覺得玩德州撲克輸贏很大程度上依賴運(yùn)氣,這種觀點(diǎn)其實(shí)是不對(duì)的。
德州撲克遠(yuǎn)不止石頭剪刀布那么簡單,有著很多策略技巧,你被高手虐過就能深刻認(rèn)識(shí)這一點(diǎn)了。毫無技巧可言的玩家,確實(shí)有可能抓到一把好牌想不贏都不行,但是德州撲克是需要投注的,依籌碼論輸贏,你看上去要贏的這一把,別人不跟你玩,你也贏不了多少,幾把下來,綜合戰(zhàn)績,高手跟低手的差距會(huì)越來越大。
DeepStack、Libratus就是國外不同大學(xué)新研究出來的德州撲克AI,已經(jīng)能夠戰(zhàn)勝人類職業(yè)牌手了。DeepStack 玩的是“一對(duì)一無限注德州撲克”,玩法比有限下注要復(fù)雜得多,不過研究DeepStack的團(tuán)隊(duì)只是發(fā)表了一篇這樣的論文而已。Libratus則模仿了 AlphaGo 的套路,提供了20 萬美元獎(jiǎng)金,公開邀請(qǐng)人類全球排名靠前的頂尖牌手對(duì)決,這顯然要比一篇論文更能吸引眼球。
可以看到,人工神經(jīng)網(wǎng)絡(luò)在“非完整信息博弈”的情況下仍然有效,電腦AI仍然能夠統(tǒng)治戰(zhàn)局。
3、星際爭霸
Google Deepmind團(tuán)隊(duì)的AlphaGo玩圍棋征服了世界棋壇,這只是他們的第一步。Deepmind還宣稱要挑戰(zhàn)暴雪公司的游戲《星際爭霸2》。
《星際爭霸2》是一款經(jīng)典的即時(shí)戰(zhàn)略游戲,由于在游戲中有“戰(zhàn)爭迷霧”的存在,即各位玩家控制的單位有視野的限制不在附近的敵方單位就看不到,這也是屬于“非完整信息博弈”?!缎请H爭霸2》的變化可要比德州撲克多得多,Deepmind何時(shí)能夠征服《星際爭霸2》,這是一個(gè)問題。
德州撲克是回合制桌游,《星際爭霸2》則是視頻游戲,是需要操作的。人類玩家玩《星際爭霸2》,需要用鼠標(biāo)鍵盤控制己方單位。而如果是電腦AI,根本就可以完全拋開鼠標(biāo)鍵盤,直接下指令,操作的準(zhǔn)確性是人類玩家無法匹敵的,簡直可以說是“神一般”的操作。
暴雪公司就聲明,電腦AI不能在操作上占人類玩家便宜,得作出限制。畢竟,電腦AI要跟人類比的只是智商,而非操作。傻子才會(huì)跟電腦比誰打字快吧?拼操作毫無意義。
電腦AI對(duì)于游戲是有著特殊意義的。其實(shí)《星際爭霸2》本身就設(shè)計(jì)有電腦AI,雖然不是使用人工神經(jīng)網(wǎng)絡(luò)技術(shù),但也具有一定程度的水平,在游戲中人類玩家可以選擇跟電腦AI對(duì)戰(zhàn),有著獨(dú)特的樂趣。也就是電腦AI陪著玩家玩游戲,在游戲制作上有著重要意義,只要游戲公司有技術(shù)實(shí)力去開發(fā)稱職的電腦AI。
在對(duì)戰(zhàn)游戲中,暴雪公司的電腦AI屬于做得很不錯(cuò)的。有很多玩家,還不一定能打得過《星際爭霸2》的專家級(jí)電腦呢。
另外,我們可以看到《星際爭霸2》是一款策略性非常強(qiáng)的游戲,如果電腦AI能夠征服《星際爭霸2》,是否意味著電腦AI能在現(xiàn)實(shí)世界正式的軍事戰(zhàn)爭中大有作為?
三、書——書法:
早在2015年,香港大學(xué)教授徐揚(yáng)生便領(lǐng)導(dǎo)他的團(tuán)隊(duì)開發(fā)出了能夠用毛筆書寫各種字體的書法機(jī)器人,效果相當(dāng)好。
在今年2017年,阿里巴巴也展示了阿里云人工智能ET現(xiàn)場為員工書寫春聯(lián)。
就筆者來看,機(jī)器人寫書法這件事,實(shí)際應(yīng)用效果并不太大,畢竟這跟直接用電腦打印各種藝術(shù)字體有多大的區(qū)別?拋開天價(jià)的名家書法作品不說,普通的書法作品,價(jià)值并不高。會(huì)有人特別想買機(jī)器人寫的書法嗎?
說起來,我們最想要的,其實(shí)是想要自己寫的字變得更漂亮一些吧……個(gè)性藝術(shù)簽名設(shè)計(jì)的需求一直這么旺盛正說明了這一點(diǎn)。有沒有能美化一般人寫的字的智能工具軟件?這還真有。日本人開發(fā)的Ougishi就是一款這樣的軟件,能將你寫的字變換成像王羲之之類書法名家寫的風(fēng)格。
大家可以看看筆者利用Ougishi創(chuàng)作出來的像模像樣的書法作品——《玄之又玄(打一字)》:
可惜的是Ougishi很早就停止版本更新了,還是停留在XP時(shí)代的技術(shù)。
筆者覺得,利用現(xiàn)在大熱的人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù),能做得更好,能有翻天覆地的新感覺。能令使用者寫的字,在保留原來的基本骨架的前提下,變成某位書法名家的筆法。這樣的技術(shù),不但可以用來美化使用者寫的字,還能用于指導(dǎo)使用者學(xué)習(xí)書法,用來練字。
四、畫-美術(shù):
1、圖片放大降噪
我們看好萊塢大片的時(shí)候,經(jīng)常看到這樣的場景:中央情報(bào)局(CIA)或聯(lián)邦調(diào)查局(FBI)的頭兒指著屏幕上監(jiān)控錄像中某一個(gè)人的臉對(duì)手下說:把這個(gè)放大看看。這樣的科技,在現(xiàn)實(shí)中要怎樣實(shí)現(xiàn)呢?
我們可以利用深度卷積神經(jīng)網(wǎng)絡(luò)來處理。卷積神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一種,是當(dāng)前語音分析和圖像識(shí)別領(lǐng)域的研究熱點(diǎn)。
這一個(gè)演示網(wǎng)站就使用了這樣的技術(shù)來對(duì)圖片進(jìn)行放大和降噪:http://waifu2x.udp.jp/。
waifu2x是專門針對(duì)插圖來進(jìn)行處理的,對(duì)照片進(jìn)行處理的效果就沒那么好。開發(fā)者先將一批插圖縮小,和原圖一起提供給機(jī)器學(xué)習(xí)如何放大縮小圖片,經(jīng)過大量數(shù)據(jù)訓(xùn)練后,機(jī)器的算法不斷自行優(yōu)化處理方式,就學(xué)會(huì)如何為其它圖片放大縮小。
依waifu2x的算法,動(dòng)漫風(fēng)格的畫,線條感明顯、色彩不太復(fù)雜的,用waifu2x來放大降噪效果非常好,線條銳利,色彩鮮明,相當(dāng)于無損放大后還降噪處理了,實(shí)際出來的效果好到讓人驚訝。但對(duì)復(fù)雜的照片,效果就不夠理想,但是也能用。
要知道,圖片是由一個(gè)個(gè)像素組成的,直接放大就是將這一個(gè)個(gè)像素都放大了,慘不忍睹。像Photoshop之類軟件、相機(jī)(手機(jī))的數(shù)碼變焦,使用的是插值放大,通過運(yùn)算在原來的像素之間插入一些新的像素,使色彩過渡得更平滑。而waifu2x能夠利用神經(jīng)網(wǎng)絡(luò),針對(duì)放大圖片的線條、顏色、網(wǎng)點(diǎn)等特點(diǎn)做特殊的算法調(diào)整,從而達(dá)到比插值放大要好得多的效果。
2、自動(dòng)描線與自動(dòng)上色
畫漫畫、插畫,描線和上色是基本功也是基本工作,如果有了自動(dòng)描線和自動(dòng)上色的新技術(shù),畫師能剩下很多工夫。描線和上色不過關(guān)的繪畫愛好者,也能借助新科技提升自己作品的水平。
在2016年,日本早稻田大學(xué)就開發(fā)出了自動(dòng)描線和自動(dòng)上色的技術(shù),使用了人工神經(jīng)網(wǎng)絡(luò)技術(shù)。
用鉛筆畫的復(fù)雜的草稿圖,能通過機(jī)器利用神經(jīng)網(wǎng)絡(luò)算法,自動(dòng)識(shí)別圖像并確定圖像的具體輪廓完成描線的工作,從而轉(zhuǎn)換成像手工描線畫出的線稿。大家來看看展示圖,效果相當(dāng)?shù)捏@人:
早稻田大學(xué)還有一項(xiàng)為黑白照片自動(dòng)上色的技術(shù),也是先行利用神經(jīng)網(wǎng)絡(luò)訓(xùn)練機(jī)器獲取經(jīng)驗(yàn)。然后,利用人工智能分析照片的整體特征,提取照片中的重要元素并進(jìn)行上色。
在2017年的年初,我們看到有這么一個(gè)能為圖片自動(dòng)上色的網(wǎng)站火了:https://paintschainer.preferred.tech/。
其技術(shù)也是利用神經(jīng)網(wǎng)絡(luò),提供許多上色插圖來讓AI不斷學(xué)習(xí)、自我完善算法,從而獲得為圖片自動(dòng)上色的技能。跟waifu2x類似,對(duì)動(dòng)漫風(fēng)格的線稿處理得很好,而對(duì)黑白照片的處理則可謂一塌糊涂。
要想效果好,提供的圖片需要是線條感明顯的線稿(網(wǎng)站上已表明 “line drawing image”)。筆者試著上傳杜甫的國畫(網(wǎng)友們不知道是否記得“杜甫很忙”這一網(wǎng)友系列惡搞涂鴉事件?),發(fā)現(xiàn)上色的效果相當(dāng)出色。大家來看看原圖跟AI處理后的圖片的對(duì)比圖。
使用者如對(duì)直接處理的色彩不滿意,還可以用網(wǎng)頁提供的工具為原圖各個(gè)區(qū)域標(biāo)注上提示顏色,再讓AI處理,效果會(huì)更理想。
筆者還試著上傳了一些黑白照片,AI的處理結(jié)果讓人掩面淚崩??磥?,要對(duì)黑白照片上色,還是得看早稻田大學(xué)的那種技術(shù)。
3、圖片合成
Ostagram是基于谷歌Deepmind算法的圖像合成工具:http://www.ostagram.ru。
這種技術(shù),也是利用了人工神經(jīng)網(wǎng)絡(luò)進(jìn)行深度學(xué)習(xí),能夠?qū)蓮垐D片很神奇地合成為一張有著令人大吃一驚的效果的圖片。大家來看看效果:
大家也可以到這個(gè)網(wǎng)站:https://deepdreamgenerator.com。
這個(gè)網(wǎng)站能提供每小時(shí)處理10張圖片的服務(wù)。這圖片數(shù)量很充裕了,因?yàn)锳I處理圖片需要時(shí)間,電腦運(yùn)算速度快的話如果沒有限制每小時(shí)能處理不止10張圖片,但到了10張的限制時(shí)稍微等一下便又能用了。
網(wǎng)站的圖片處理有預(yù)設(shè)的風(fēng)格。當(dāng)然,大家肯定是想自己玩一下個(gè)性風(fēng)格。那么,需要先上傳一張?jiān)瓐D,再上傳一張作為風(fēng)格參考的圖片,處理時(shí)有一些參數(shù)控制,懂的網(wǎng)友可以自己再調(diào)整一下。AI會(huì)提取第二張圖片的風(fēng)格特征,用于處理第一張圖片。
你可以上傳一張照片,再上傳一張某種風(fēng)格的畫作,于是AI會(huì)將照片處理成某種畫風(fēng)的樣子。于是,人人都可以成為大畫家量產(chǎn)畢加索了!當(dāng)然,你盡可以異想天開,發(fā)揮腦洞,用令人意想不到的圖片,合成出似乎不會(huì)出現(xiàn)在這個(gè)世上的神奇圖片來。
最近,美國康奈爾大學(xué)與Adobe公司也研發(fā)出了一項(xiàng)類似谷歌Deepmind的技術(shù)“Deep Photo Style Transfer”,能將一張圖片的風(fēng)格套用到另一張圖片上,包括色彩以及光線。
通過深度學(xué)習(xí)程序,AI能對(duì)照片中的色彩與光線性質(zhì)進(jìn)行分析,理解并還原照片的天氣狀況、季節(jié)、時(shí)間,還能區(qū)分天空和大地。在實(shí)際應(yīng)用中也做得更好,不但能從整體上改變圖片的風(fēng)格,還能只針對(duì)圖片的某一細(xì)節(jié)部分進(jìn)行改變,例如一棟大樓的窗戶。
預(yù)計(jì)“Deep Photo Style Transfer”這一項(xiàng)技術(shù)未來可能成為Photoshop中的一個(gè)插件,能令用戶如虎添翼。
五、文學(xué)創(chuàng)作:
用電腦AI來玩文學(xué)可謂“歷史悠久”了。微軟亞洲研究院自然語言計(jì)算組研究開發(fā)有電腦對(duì)聯(lián),至于作詩的則是一抓一大把,有的還宣稱通過了圖靈測試。但是通過了圖靈測試又怎么樣呢?只是讓人無法分辨到底是人類還是人工智能創(chuàng)作的,并不代表好壞。要想實(shí)際應(yīng)用,還得達(dá)到一定程度的文學(xué)欣賞水準(zhǔn)。
谷歌為了使他們的AI更加健談,讓AI閱讀了大量的愛情小說,于是AI現(xiàn)在也能寫出一些多愁善感的詩歌了。谷歌的工程師為AI設(shè)計(jì)了每首詩的開頭和結(jié)尾,然后AI能往中間填充適當(dāng)?shù)木渥訌亩堰@些內(nèi)容串起來成為完整的詩。但AI只是一遍一遍地重復(fù)學(xué)習(xí)過的語句,它并沒有一雙在生活中尋找發(fā)現(xiàn)的眼睛,無法發(fā)揮創(chuàng)意。
我們可以看到這個(gè)世界已經(jīng)有很多寫作軟件。最近熱議的網(wǎng)文抄襲事件也讓人見識(shí)到了寫作軟件的“厲害”之處。
正可謂“天下文章一大抄”,現(xiàn)在國內(nèi)的一些寫作軟件號(hào)稱“寫作神器”,能夠提供許多寫作素材,方便作者調(diào)用,當(dāng)然,這些寫作素材是從網(wǎng)上搜集來的,版權(quán)方面問題很大,作者調(diào)用這些素材來寫作當(dāng)然得算抄襲。
因?yàn)檫@類寫作軟件用起來太方便,不少網(wǎng)絡(luò)小說作者就是愛用,被發(fā)現(xiàn)抄襲并舉報(bào)的一大批,就有小說被網(wǎng)站封掉的。這類“寫作神器”,只是將網(wǎng)文書庫里的那些描寫隨機(jī)組合,談不上什么人工智能。
順便說一下,我們見到的寫作軟件,還提供角色姓名、地名、門派、功法、兵器等等隨機(jī)起名等工具,對(duì)小說作者還是很有用的,先隨機(jī)起一個(gè)名字,再修改美化一下,也不怕犯抄襲。
還有,寫小說更重要的是編故事。國內(nèi)暫時(shí)還不見有這方面功能突出的寫作軟件,一般頂多提供故事樹模板讓作者自行填寫。
在國外,有做得更好的寫作軟件。如Dramatica這個(gè)軟件,內(nèi)置了超過3萬個(gè)故事結(jié)構(gòu),分門別類,能從一開始引導(dǎo)使用者一步一步地將想法化為及格的故事,如何設(shè)計(jì)沖突、塑造人物。
Dramatica是一款不錯(cuò)的寫作軟件,可惜只有英文版,國內(nèi)的作者不好用。Dramatica在寫作的過程起的是引導(dǎo)、提醒、評(píng)估等的作用,雖然有作用,可謂不錯(cuò)的智能工具,但也談不上多高級(jí)的人工智能。
然而隨著人工智能的發(fā)展,它遲早會(huì)進(jìn)入文學(xué)創(chuàng)作的核心領(lǐng)域?,F(xiàn)在AI能做更厲害的事情了。
日本科研人員開發(fā)的AI,寫出的小說拿來參加比賽,都能通過初審了。紐約大學(xué)的AI研究人員就用AI創(chuàng)作了一部電影劇本,這個(gè)劇本隨后被拍成了一部名為《Sunspring》的短片,主角的飾演者也是飾演過美劇《硅谷》男主角查理的 Thomas Middleditch,該短片參加了倫敦科幻電影節(jié)(Sci-Fi London) 48 小時(shí)挑戰(zhàn)單元。
跟小說創(chuàng)作相比較,新聞寫作更容易讓AI上手。現(xiàn)在國內(nèi)的騰訊、阿里巴巴、今日頭條等等紛紛推出了自己的自動(dòng)化新聞寫作AI。
新聞寫作跟小說寫作不同,不需要“無中生有”創(chuàng)造出一個(gè)新故事,只需要挖掘線索,管理素材,容易實(shí)現(xiàn)模板式寫作。而且,AI要比人類博聞強(qiáng)記,整理線索和素材要比真人強(qiáng),相較真人寫作,是擁有一方面優(yōu)勢的。你說,發(fā)些財(cái)經(jīng)消息、體育比賽訊息,需要多高文學(xué)水平???用AI來編寫不更省力省時(shí)間?
新聞報(bào)道這類屬于非虛構(gòu)文學(xué)創(chuàng)作,而小說一般屬于虛構(gòu)文學(xué)創(chuàng)作,前者目前的電腦AI有辦法應(yīng)付,而后者目前還存在諸多不足。研究小說創(chuàng)作的AI,要求研究者得懂小說創(chuàng)作。
建議相關(guān)研究者先研究一下類似Dramatica這樣的軟件,弄懂怎樣引導(dǎo)AI寫出一篇各方面結(jié)構(gòu)完善的小說。也就是先做好小說建模,讓AI寫出一篇及格的小說。之后,也可以利用人工神經(jīng)網(wǎng)絡(luò),提供海量數(shù)據(jù),訓(xùn)練AI寫出更好的小說。
我們可以看看前面提到的日本人工智能研究人員是怎么做的。有兩種典型的創(chuàng)作方法。
日本公立函館未來大學(xué)教授松原仁率領(lǐng)的團(tuán)隊(duì)名為“任性的人工智能之我是作家”,其兩部作品是由人類事先設(shè)定好登場人物、內(nèi)容大綱等相當(dāng)于文章“零部件”的內(nèi)容,人工智能AI再根據(jù)這些內(nèi)容自動(dòng)生成小說。
這一種,AI做的主要方面是“描寫”,感覺有些類似網(wǎng)絡(luò)寫手設(shè)定好故事情節(jié)之后,利用國產(chǎn)“寫作神器”抄襲別人作品的描寫。筆者不免有些擔(dān)心,AI寫作是否會(huì)遭遇版權(quán)問題?又如谷歌的AI,學(xué)了那么多愛情小說的句子,重新排列組合,要到怎么樣的隨機(jī)程度,才能洗脫抄襲的嫌疑?
東京大學(xué)副教授鳥海不二夫率領(lǐng)的團(tuán)隊(duì)“人狼智能”的兩部作品,則在人工智能之間玩“狼人游戲”(一款推理類桌游),然后選出有意思的故事發(fā)展,再由人類改編成小說。筆者更欣賞這一種方式,而且這不就是美劇的編劇方式嗎?美劇的故事情節(jié)總是有許多方向的發(fā)展可能,而編劇會(huì)根據(jù)情況選擇其中的一種。
筆者有些腦洞,相關(guān)研究者不妨參考一下。比如說,谷歌的圖像合成算法Deepmind也可以運(yùn)用到小說改編上,也就是將兩部不同的小說合成一部神奇的小說。例如,將《三國演義》跟《紅樓夢》合體,會(huì)怎么樣?提取《紅樓夢》的風(fēng)格特征,重新演繹《三國演義》,出來的效果會(huì)如何?AI的演算結(jié)果相信會(huì)令世人震驚不已……
這一種方式,也有很大的實(shí)用意義。比如某影視公司買下了某軍事小說的版權(quán),又買下某言情小說的版權(quán),公司高層想某軍事小說改編影視劇時(shí)加入愛情元素從而更適應(yīng)市場的娛樂審美,那么,能否提取某愛情小說的風(fēng)格特征,重新演繹某軍事小說?
這并不是不可能做到的事。先說簡單的,讓智能機(jī)器人為小孩講故事。這現(xiàn)在就能做到,故事從素材庫里隨機(jī)抽取便可,但要想講的故事有更多變化不讓人膩味,能怎么做呢?
比如說有一個(gè)A故事:小熊不會(huì)爬樹,熊媽媽鼓勵(lì)它。又有一個(gè)B故事,小鳥學(xué)唱歌。我們可以訓(xùn)練AI,將A故事和B故事合成一個(gè)新的C故事:小鳥不會(huì)唱歌,鳥媽媽鼓勵(lì)它。這是非常簡單的變換。
只要我們繼續(xù)努力去研究,相信能做出更復(fù)雜的變換,提取《三國演義》的風(fēng)格特征重新演繹《紅樓夢》并不是夢。Deepmind創(chuàng)造出的神奇圖片,表明了“關(guān)公戰(zhàn)秦瓊”也許會(huì)非常精彩。讓我們一起去夢想吧。(本文首發(fā)鈦媒體)






快報(bào)
根據(jù)《網(wǎng)絡(luò)安全法》實(shí)名制要求,請(qǐng)綁定手機(jī)號(hào)后發(fā)表評(píng)論
人工智能雖然現(xiàn)在只處于初級(jí)階段,但已經(jīng)慢慢的影響了我們的生活,想現(xiàn)在的語音類軟件,靈犀語音助手,siri等,這些軟件讓我們的生活更加便利。很期待以后不需要?jiǎng)邮值娜兆印?/p>
邏輯無誤后相關(guān)計(jì)算運(yùn)作都有可能。
藝術(shù)的背后也只是我們理智的不完備
不僅僅是
麻將上吧