人工智能“小冰”創(chuàng)作的原創(chuàng)畫作被當成了Bing的首頁圖
繼寫作、唱歌后,微軟人工智能“小冰”又實現(xiàn)了原創(chuàng)繪畫的能力。
5月16日,微軟正式對外發(fā)布人工智能小冰的繪畫模型。微軟表示,該模型通過對過往四百年藝術(shù)史上236位人類畫家畫作的學習,獨立完成100%原創(chuàng)的繪畫作品,接近專業(yè)人類畫家水準。
作為Bing中國及日本、微軟小冰全球產(chǎn)品線負責人,微軟(亞洲)互聯(lián)網(wǎng)工程院副院長李笛及他的團隊設(shè)計了一個巧妙地聯(lián)動——用人工智能微軟小冰的一副原創(chuàng)畫作,當做了今天Bing中國的封面圖。李笛表示,不同于簡單的復制、調(diào)色、隨機生成,微軟小冰的繪畫能力是基于文本或其他創(chuàng)作源激發(fā),由人工智能100%原創(chuàng)的繪畫作品。
值得一提的是,今年微軟小冰以“夏語冰”的化名通過了畢業(yè)考試成為了中央美術(shù)學院的碩士畢業(yè)生,并且在中央美術(shù)學院2019屆研究生畢業(yè)作品展上首次展出。同時,小冰的首次個人作品展將于6月舉行。
與詩歌一樣,“小冰”的繪畫能力也會通過小程序運營推廣給大眾,“少女畫家小冰”繪畫創(chuàng)作小程序?qū)⒃谝恢芎螅?月22日)上線。
幾年前阿爾法狗戰(zhàn)勝了人類九段棋手李世石,“人工智能究竟有多像人類”、“人工智能會替代人類嗎?”、“人工智能究竟能做到哪一步”等等爭論就從未停歇。而讓人工智能創(chuàng)作,似乎又是一個充滿爭議的方向。
談到為什么要讓人工智能進行創(chuàng)作,李笛表示,目前世界上大多數(shù)人工智能的開發(fā)都是圍繞著任務(wù)驅(qū)動型、知識型的路線來架構(gòu)。但近些年,各大科技公司開始越發(fā)注重對人工智能EQ(情商)的開發(fā),不僅僅是微軟,亞馬遜開始希望Alexa能夠有同理心。百度也提出“智能體”這個概念,要求人工智能更加有個性,更加有人設(shè)。人工智能的構(gòu)建已經(jīng)從單純的IQ開始向IQ+EQ演變。(詳見鈦媒體前文:第六代小冰上線了,微軟為什么要花四年時間探索情感 AI?)
“我們希望人工智能創(chuàng)造的目的,不是取勝,而是面向高度定制化的時代的內(nèi)容供需關(guān)系。提供更快、更穩(wěn)定、高并發(fā)的創(chuàng)作能力。”
小冰目前會唱歌(語音)、會寫作(文本),而今天新發(fā)布的模型則賦予了小冰繪畫(視覺)的能力。
以鈦媒體現(xiàn)場來看,目前小冰的唱歌能力是最強的?,F(xiàn)場也公開小冰演唱模型的第五個版本。除了能讓小冰像人一樣“換氣延長”外,新模型還改善了歌聲唱腔轉(zhuǎn)換的自然度,并首次公布了戲腔訓練成果。而李笛也透露,比起友商來說,小冰平均舒適時長、也就是聽眾能夠接受的最大連續(xù)播放時長是最高的。小冰的ACD(有聲讀物·平均舒適時長能夠達到21.5分鐘,而友商基本在五分鐘以下。
而在文學創(chuàng)作上,小冰的詩集也在一定程度上引起了爭議(詳見鈦媒體文章:人工智能寫作的天花板在哪里?),而對于更加依賴主觀的“繪畫”,很難用畫的“好不好”來評價這些作品,但毋庸置疑,人工智能做原創(chuàng)輸出已經(jīng)非常不容易了。微軟亞洲互聯(lián)網(wǎng)工程院為對該項目的研發(fā)已經(jīng)整整持續(xù)了22個月。
對于爭議,微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理徐元春現(xiàn)場呼吁,不要帶著“有色眼鏡”去看人工智能創(chuàng)作。“人類一旦戴上這種有色眼鏡之后,他所提供的反饋就都是錯誤的,有可能會把我們引向另外一個極端。”
拋開大量技術(shù)細節(jié),小冰繪畫模型有兩大特點:特點一:會大量使用誘發(fā)源,不是讓機器把一種已有的視覺元素轉(zhuǎn)成另外一種風格重新生成,而是要求在誘發(fā)源的幫助下,激發(fā)人工智能進行重新的創(chuàng)作,這是這個模型最顯著的特點。特點二:機器在這個過程中會對人類社會最頂尖的藝術(shù)創(chuàng)作進行大量的學習。
但在鈦媒體來看,小冰的創(chuàng)作仍然距離人類創(chuàng)作還有點遠。在命題創(chuàng)作上,乍一看,上述畫作是頗具“藝術(shù)色彩”的,但如果仔細理解“中國的城市化進程”這個命題,小冰所畫的內(nèi)容基本上都在“建筑”、“人”、“家具”這幾個模棱兩可的元素上來回重復,有點類似“xx星座就是這樣的”巴納姆效應(yīng)。
![]()
小冰以(左圖)“自由”和(右圖)“束縛”為創(chuàng)作源所做的畫作
小冰以“中國的城市化進程”為命題,仿照人類畫家的風格進行的命題創(chuàng)作。
與詩歌一樣,“小冰”的繪畫能力也會通過小程序運營推廣給大眾,將在一周后(5月22日)上線面向大眾的繪畫創(chuàng)作小程序。在小程序中輸入創(chuàng)作詞語,小冰就會開始沿著以下程序進行繪畫原創(chuàng),這比小冰寫詩的過程要復雜得多。
但現(xiàn)場開放的小程序版本并不能像上述DEMO中那樣完全理解命題。當鈦媒體編輯把“中國的城市化進程”這個命題輸入到測試版的小冰繪畫小程序里,小冰甚至回答“這些內(nèi)容不好發(fā)揮,再換一個吧”。
而即便是輸入“城市”這個詞語,可以看到,小程序中的小冰依舊會把城市跟椅子、時鐘這類的元素聯(lián)系到一起,畫作也不算完整,甚至有些過于抽象。
不過,值得思考的一件事情是,類似小冰這種“情商”比較高的人工智能們的商業(yè)化價值在哪兒?李笛表示,在文本創(chuàng)作、語音創(chuàng)作和繪畫創(chuàng)作上,小冰團隊都已經(jīng)尋找到明確的產(chǎn)業(yè)化落地場景。目前微軟小冰在各內(nèi)容生成領(lǐng)域的進展如下:
一方面,情商高的人工智能被塑造成IP,以虛擬歌手、虛擬作家、虛擬畫家的身份被運營。但如果說歌手、主持人、畫家都無法帶來“普通”的規(guī)模性收益,“小冰”們更多的商業(yè)價值是體現(xiàn)在需要簡單創(chuàng)作能力、重復性強而又人才稀缺的崗位。
在小冰擅長的語音方面,除了大家比較熟悉的虛擬主播工作外,小冰更大的潛力是在有聲讀物上,“在國內(nèi)的少兒有聲讀物這個領(lǐng)域,是處于供不應(yīng)求的狀態(tài)。”
在文本輸出上,小冰更多的價值體現(xiàn)在高效地提供格式、內(nèi)容規(guī)范的文本創(chuàng)作上。人類編輯相比,小冰輸出速度極快,可以穩(wěn)定地提供20秒級的輸出,即一旦得到一個數(shù)據(jù),20秒之后就可以完成摘要和研報的生成。小冰已與萬得資訊、華爾街見聞等機構(gòu)達成了長期合作。
而繪畫能力的商業(yè)價值,還體現(xiàn)在原創(chuàng)、版權(quán)上。
正如發(fā)布會現(xiàn)場,徐元春對Bing封面圖的打趣一樣,“這樣圖我們完全擁有版權(quán),不用再付一遍版權(quán)費了”,穩(wěn)定的、高質(zhì)量的、完整擁有版權(quán)的、可大規(guī)模創(chuàng)作的能力,是人工智能繪畫設(shè)計能力能夠大規(guī)模被商業(yè)化應(yīng)用的基礎(chǔ)。
目前,小冰的繪畫能力所瞄準的落地場景是服裝面料設(shè)計,去為稀缺的一線原創(chuàng)圖樣設(shè)計師進行補位。
據(jù)鈦媒體現(xiàn)場了解,以微軟小冰人工智能框架為基礎(chǔ),微軟已經(jīng)中國紡織工業(yè)聯(lián)合會以及幾家最大的紡織面料企業(yè)聯(lián)合開發(fā)了人工智能紡織服裝面料設(shè)計平臺。在這個平臺上,支持幾十種目前非常流行的紋樣和插話的設(shè)計,不重復的多樣性可以做達到10的26次方。“地球上所有沙子的數(shù)量是10的23次方,所以理論來講,這一套系統(tǒng)可以為地球上的每一粒沙子繪制一個完全不同的表面。”
(本文首發(fā)鈦媒體,作者/趙宇航)
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
這些內(nèi)容不好發(fā)揮,換一個吧哈哈哈