天天要聞:AI繪畫的“小秘密”都在這一篇文章里
視覺中國供圖
(相關(guān)資料圖)
◎本報記者 金 鳳
有了AI,人人都可以是藝術(shù)家。AI繪畫的出現(xiàn),恰如瑞士藝術(shù)家保羅·克利所言:“藝術(shù)不是再現(xiàn)可見,而是使不可見成為可見?!苯?jīng)過20年左右的發(fā)展,目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同,發(fā)展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當(dāng)然,也有團隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù)。
上傳一張圖片,或者輸入一些簡單的關(guān)鍵詞,系統(tǒng)就能自動生成一張卡通圖像……最近一段時間,AI繪畫開始在互聯(lián)網(wǎng)社交平臺走紅。
AI繪畫,顧名思義就是利用人工智能進行繪畫,是人工智能生成內(nèi)容的典型應(yīng)用場景之一。其主要原理是收集大量已有作品,通過算法對其內(nèi)容和風(fēng)格特征進行解析,最后再生成新的作品,所以算法是AI繪畫的核心。
當(dāng)前,“憑空”生成圖像的AI繪畫,其實也會動輒“翻車”:也許上一秒AI通過你的照片繪出的是一張充滿藝術(shù)感的二次元畫像,下一秒你的寵物貓、狗則可能被畫成可愛少女或肌肉猛男。
事實上,AI繪畫早已火爆全球。第一張公開展出的、由人工智能創(chuàng)作的繪畫作品《埃德蒙·貝拉米的肖像》曾于2018年在佳士得拍賣行以43.25萬美元成交,那是一張由機器學(xué)習(xí)了從14世紀到20世紀的1.5萬張肖像畫之后自動生成的一張肖像畫作品。
AI繪畫是如何實現(xiàn)“憑空”生圖的?除了娛樂外,AI繪畫還有哪些潛在的應(yīng)用前景?
從“以圖生圖”到“語音生圖”
2022年,由人工智能創(chuàng)作的《太空歌劇院》一度火出圈。在美國科羅拉多州舉辦的新興數(shù)字藝術(shù)家競賽中,《太空歌劇院》獲得“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎。它的構(gòu)圖、配色以及畫面的細節(jié)堪稱精致。然而,這個作品的創(chuàng)作者不是藝術(shù)家,而是來自美國科羅拉多州的游戲設(shè)計師。
這位游戲設(shè)計師在一個名為“Midjourney”的AI創(chuàng)作工具里,先輸入幾個關(guān)鍵詞,如光源、構(gòu)圖、氛圍等,得到了100幅作品,再進行約80小時的修圖修飾,最終選出3幅作品,最后把圖像打印到畫布上。
通過簡單交互式對話在短時間內(nèi)生成的“藝術(shù)”作品,讓人類藝術(shù)家展開了一場關(guān)于“AI繪畫作品參賽是否屬于作弊”的爭論。這場聲勢浩大的爭論也令大眾直觀地意識到如今的AI繪畫水平已經(jīng)發(fā)展到了何種程度。
“人工智能在藝術(shù)方面的創(chuàng)作最早可以追溯到上個世紀末,當(dāng)時的人工智能繪畫技術(shù)叫作‘圖像的風(fēng)格化濾鏡’?!敝袊茖W(xué)院自動化研究所多模態(tài)人工智能系統(tǒng)全國重點實驗室研究員董未名說,最初的AI繪畫方法比較簡單,比如一張普通的照片,通過一些圖像處理的算法,把照片像素進行幾何或者色彩上的變換,然后再調(diào)節(jié)不同參數(shù),就可以模擬出類似油畫或者水彩畫的風(fēng)格。
經(jīng)過20年左右的發(fā)展,目前基于不同類型或者模態(tài)元素的AI繪畫發(fā)展情況不盡相同,發(fā)展最久的是“以圖生圖”,再到近期火爆的“文+圖”生圖。當(dāng)然,也有團隊已經(jīng)研發(fā)出由語音生成圖像的技術(shù)。
AI繪畫主要依靠三種技術(shù)模式實現(xiàn)
董未名介紹,目前AI繪畫主要借助圖像風(fēng)格遷移技術(shù)、圖文預(yù)訓(xùn)練模型和擴散模型實現(xiàn)。
“圖像風(fēng)格遷移技術(shù)指的是圖像處理算法通過對輸入的真實圖像內(nèi)容特征和對參考的藝術(shù)圖像風(fēng)格特征的提取,實現(xiàn)真實圖像內(nèi)容特征和藝術(shù)圖像風(fēng)格特征的融合,從而生成新的藝術(shù)圖像?!倍疵e例,如果將美國舊金山藝術(shù)宮的外景照片和印象派創(chuàng)始人莫奈繪制的作品,通過圖像風(fēng)格遷移技術(shù)進行融合,就能得到一張看起來像是由莫奈繪制的美國舊金山藝術(shù)宮的繪畫作品。最初的AI繪畫采用的正是這種技術(shù)。
不過,在董未名看來,圖像風(fēng)格遷移技術(shù)大多依賴的是生成式對抗網(wǎng)絡(luò)(GAN)算法,它最大的問題是生成的繪畫作品藝術(shù)性不強,筆觸和構(gòu)圖讓人覺得與真實的繪畫有差距,所以長久以來,AI繪畫一直“籍籍無名”。
當(dāng)圖像風(fēng)格遷移技術(shù)還在掙扎于輸出作品的審美問題時,圖文預(yù)訓(xùn)練模型的出現(xiàn),加速了AI繪畫的崛起。
“依托圖文預(yù)訓(xùn)練模型,只要輸入一句話或者上傳一幅風(fēng)格明顯的圖片,算法就能將圖像特征和文字特征‘對齊’。生成的繪畫作品的內(nèi)容特征和上傳圖片的內(nèi)容相似,藝術(shù)性也比圖像風(fēng)格遷移技術(shù)生成的圖片強很多。”董未名舉例,比如支撐圖文預(yù)訓(xùn)練模型的可對比語言—圖像預(yù)訓(xùn)練(CLIP)算法,就是利用圖文特征“對齊”的能力,再結(jié)合已有的生成模型,實現(xiàn)“以圖生圖”或者“圖+文”生圖。
不過,董未名坦言,圖文預(yù)訓(xùn)練模型的推廣也存在一些爭議,有部分人認為,該模型在訓(xùn)練前期,需要用大量的圖形處理器(GPU)進行數(shù)據(jù)訓(xùn)練,耗電量大、成本很高,而該模型的應(yīng)用場景卻不夠清晰。但也有人認為,也許該模型未來可以打造為通用的人工智能模型,用它完成更多的算法作業(yè),只是這還需要時間的驗證。
誠然沒有一項技術(shù)是完美的,這也為人類探究更先進的技術(shù)提供了無限動力。當(dāng)下最流行的擴散模型便是其中之一。
“目前最新的AI繪畫技術(shù)采用的就是擴散模型,這種模型可以把一個隨機采樣的噪聲輸入模型,然后嘗試通過去噪來生成圖像?!倍疵硎?,擴散模型也存在弱點,由于模型對圖片內(nèi)容識別的能力不足,或者難以完全理解識別文字的意義,以及訓(xùn)練數(shù)據(jù)的偏差,有時便會生成“四不像”的作品。此外,擴散模型生成圖片的速度比較慢,目前還達不到實時生成圖片。
互聯(lián)網(wǎng)治理、元宇宙或潛藏應(yīng)用前景
AI繪畫目前的應(yīng)用場景,更多聚焦于社交軟件。近期在國內(nèi)社交網(wǎng)絡(luò)“火出天際”的AI繪畫軟件主要集中在小程序及App。隨著AI繪畫小程序的火爆,短視頻平臺抖音也迅速上線了AI繪畫特效。同時,此前騰訊上線了“QQ小世界AI畫匠”活動,百度也推出了首款A(yù)I藝術(shù)和創(chuàng)意輔助平臺“文心一格”。
有了AI,人人都可以是藝術(shù)家。AI繪畫的出現(xiàn),恰如瑞士藝術(shù)家保羅·克利所言:“藝術(shù)不是再現(xiàn)可見,而是使不可見成為可見?!薄癆I現(xiàn)在已經(jīng)完美實現(xiàn)了這一目標(biāo),人們可以通過機器計算來繪制出很多現(xiàn)實中見不到的場景?!倍疵麜诚?,不遠的將來,AI繪畫或許還將展現(xiàn)更豐富的應(yīng)用場景。
“現(xiàn)在網(wǎng)絡(luò)上充斥著很多不良內(nèi)容,這些內(nèi)容為了逃避監(jiān)管經(jīng)常以繪畫的形式出現(xiàn),而當(dāng)前很多內(nèi)容識別模型對真實圖片識別得很準確,但缺乏不良內(nèi)容藝術(shù)作品的相關(guān)訓(xùn)練數(shù)據(jù),所以對不良內(nèi)容識別不準確。也許可以用AI繪畫技術(shù),積累不良內(nèi)容藝術(shù)作品的數(shù)據(jù),并用以訓(xùn)練識別模型,以提升互聯(lián)網(wǎng)內(nèi)容的安全監(jiān)管能力和識別的準確率?!倍疵ㄗh。
在董未名看來,作為一種藝術(shù)呈現(xiàn)形式,AI繪畫也將在元宇宙、設(shè)計、文旅等行業(yè)催生新的商業(yè)模式。例如AI繪畫目前在AI輔助創(chuàng)作、短視頻、影視制作和元宇宙等方面都有布局,因為這些賽道都離不開創(chuàng)意,AI繪畫可以幫助創(chuàng)作者通過簡單的特征輸入,實現(xiàn)對其創(chuàng)意的預(yù)覽,甚至可以直接進行創(chuàng)作。
不過,董未名并不諱言,當(dāng)下AI繪畫仍然存在版權(quán)爭議問題。AI繪畫的核心是模型,而訓(xùn)練模型需要使用大量圖像、文本數(shù)據(jù)。對于未經(jīng)授權(quán)的圖片,經(jīng)過運算之后所生成的圖像版權(quán)歸屬尚難界定?!坝械漠嫾绎L(fēng)格特別明顯,如果用畫家的畫去訓(xùn)練算法模型生成作品,那最后的版權(quán)屬于誰呢?”董未名提出的問題,正是多數(shù)AI繪畫作品所面臨的現(xiàn)實問題。
AI繪畫掀起了一場資本的群體狂歡,希望有一天它能走出“照貓畫虎”的尷尬,真正服務(wù)藝術(shù)創(chuàng)作、創(chuàng)造更多價值。
關(guān)鍵詞:
相關(guān)閱讀
-
天天要聞:AI繪畫的“小秘密”都在這一...
不過,在董未名看來,圖像風(fēng)格遷移技術(shù)大多依賴的是生成式對抗網(wǎng)絡(luò)... -
買漲不買跌是什么意思?怎么查自己基金...
如果想要進入基金市場購買基金,那么投資者都是需要準備好自己的基... -
全球視訊!西安到上?;疖嚻辈樵儯ㄎ靼?..
1、西安站到上海站火車共計12個車次。2、票價:硬臥 無座180 5元... -
刷相機的固件(刷相關(guān)搜索)
1、面些簡單介紹注意點:關(guān)于網(wǎng)站搜索更新頻率百度搜索設(shè)定網(wǎng)站更新... -
存入信用卡的資金能用來還款嗎?黃金暴...
一般情況下信用卡是不可以存錢的,用戶在信用卡賬單之外存入信用卡... -
毛豬300斤今日價格(毛的筆順)
1、毛的筆順為撇、橫、橫、豎彎鉤。2、毛的意思1 動植物的皮上所生... -
中銀活期寶的收益率是多少?經(jīng)濟滯脹的...
經(jīng)濟滯脹指的是,當(dāng)資本主義國家在同一時間內(nèi)出現(xiàn)經(jīng)濟停滯或者衰退... -
有哪些成本低高收入的創(chuàng)業(yè)項目?電子儲...
儲蓄國債包括憑證式和電子式,是政府面向個人投資者發(fā)行、以吸收個... -
投資黃金的優(yōu)勢有哪些?通縮情況發(fā)生后...
金融市場中存在著諸多專業(yè)術(shù)語,就像是通縮、通脹等,這些詞語往往... -
動態(tài)焦點:信號!A股,新一輪上漲或?qū)砼R
信號!A股,新一輪上漲或?qū)砼R -
環(huán)球時訊:板塊異動|機構(gòu)集體看多2023...
板塊異動|機構(gòu)集體看多2023年A股證券板塊開盤活躍 -
焦點熱門:犀牛早訊:馬云不再實控螞蟻集...
犀牛早訊:馬云不再實控螞蟻集團?建發(fā)股份擬控股美凱龍 -
永祺車業(yè)闖關(guān)A股,近9成收入來自境外,...
永祺車業(yè)闖關(guān)A股,近9成收入來自境外,哈羅、美團消失在前五大客戶 -
有人說A股新年迎來“陽康牛” 別著急 ...
有人說A股新年迎來“陽康?!眲e著急春節(jié)前或還有三大隱憂! -
2023年上市,沃爾沃MPV假想圖曝光
1月9日,相關(guān)媒體繪制了一組沃爾沃MPV的假想圖,該假想圖以極氪009... -
快訊 | 2023年下半年推出,阿維塔第二...
1月9日消息,近日在阿維塔總部大樓落成儀式上,阿維塔科技董事長兼C... -
smart聯(lián)手億咖通打造的汽車智能座艙計算...
1月6日消息,在拉斯維加斯舉行的CES2023(2023國際消費電子展)上,... -
世界關(guān)注:揚州通報網(wǎng)傳領(lǐng)導(dǎo)干部生活作...
近日網(wǎng)傳揚州市有關(guān)領(lǐng)導(dǎo)干部生活作風(fēng)問題,揚州市委市政府高度重視... -
天天百事通!各地推進新冠病毒感染“乙...
1月8日0時17分許,中國南方航空CZ312多倫多至廣州航班順利降落在廣... -
年輕人爭相打卡“國潮”消費
凸顯文化自信,促進產(chǎn)業(yè)升級年輕人爭相打卡“國潮”消費憨態(tài)可掬的...