亚洲欧美综合a一区久久国语自产精品视频 ,国产成人91国精品,久久97精品久久久久久久不卡站长

登錄
|
注冊

首頁 > 藝術(shù)新聞 >滾動新聞> 正文

人工智能圖像生成：魔法、藝術(shù)和影響

時間：2023/3/31 21:08:08　　來源：中國藝術(shù)報

在今年的全國兩會上，科技部部長王志剛在兩會“部長通道”對媒體表示：“ChatGPT之所以引起關(guān)注，在于它作為一個大模型，有效結(jié)合了大數(shù)據(jù)、大算力、強(qiáng)算法……總的來講，人工智能是大方向、大領(lǐng)域，它的影響絕不僅僅在科技領(lǐng)域本身?！?br>

2022年11月30日，美國OpenAI公司發(fā)布的智能對話大模型產(chǎn)品ChatGPT開始風(fēng)靡全球，僅兩個月，活躍用戶就超1億，并引發(fā)科技巨頭間的爭奪。而ChatGPT的對話體驗引發(fā)人們對AI即人工智能未來能力的重新認(rèn)識，人們對ChatGPT和以ChatGPT為代表的這一波AI新浪潮能做什么極為關(guān)注。如果參照歷史，我們會看到每次技術(shù)飛躍都會給社會帶來巨變，也會帶來陣痛。AI的發(fā)展，使得我們正站在這樣一個節(jié)點，未來的社會分工和結(jié)構(gòu)將會發(fā)生更大的變化，而身處其中的我們都會被深刻地影響。尤其是在塑造人的精神世界的藝術(shù)領(lǐng)域，處在一個即將被劇烈顛覆的前臺，文藝從業(yè)者自身必須積極改變以適應(yīng)這樣的一個位置。

AI進(jìn)軍此前被視為“人類獨占”的領(lǐng)域——藝術(shù)表達(dá)。最初AI的滲透是緩慢的，但在這半年多時間可謂逐漸形成了一場搶奪戰(zhàn)。2022年9月，杰森·艾倫在科羅拉多州博覽會藝術(shù)展上提交了一件名為《太空歌劇院》的藝術(shù)作品，該作品是使用人工智能工具創(chuàng)作的，獲得了數(shù)字藝術(shù)照片類別比賽第一名。允許提交作品的評委并不知道這是人工智能生成的，但在它獲勝并且眾所周知它是由AI生成后，所獲獎項并沒有被評委撤回。為什么？因為之前的規(guī)則中沒有任何規(guī)定提及AI作品不能參賽，真正的反對來自社交媒體和憤怒的藝術(shù)家，一些人要求艾倫歸還他的獎項并公開道歉。艾倫的回應(yīng)是：“人工智能是一種工具，就像畫筆是一種工具，工具背后還需要一種創(chuàng)造力?！庇懈嗟娜藲g迎這種對話，科羅拉多州農(nóng)業(yè)部的傳播總監(jiān)表示，很高興這個擁有150年歷史的博覽會成為“討論藝術(shù)的一部分”。這個新聞事件在這個歷史時刻具有特別重要的意義，意味著AI開始對藝術(shù)產(chǎn)生影響。AI作品是否構(gòu)成藝術(shù)？藝術(shù)家受到這種新形式的威脅，是否應(yīng)該接受它？這個新聞事件可能會推動人工智能生成內(nèi)容（AIGC）作為藝術(shù)的一種形式，并幫助人類的思維轉(zhuǎn)變。

AI圖像生成技術(shù)的工作原理是訓(xùn)練兩個神經(jīng)網(wǎng)絡(luò)：一個生成新圖像的生成器網(wǎng)絡(luò)，一個試圖區(qū)分真假圖像的鑒別器網(wǎng)絡(luò)。通過這些網(wǎng)絡(luò)之間的競爭和協(xié)作過程，AI可以生成在風(fēng)格和內(nèi)容上與它們接受訓(xùn)練的圖像相似的新圖像，通過文本的輸入，使用計算機(jī)算法來創(chuàng)建圖像。這種通過文本生成圖像的方式與傳統(tǒng)的圖像生成技術(shù)之間的主要區(qū)別之一是所需的人類參與程度，傳統(tǒng)技術(shù)通常需要大量的手動輸入和用戶的專業(yè)知識來創(chuàng)建和完善圖像，而AI圖像生成幾乎不需要人工干預(yù)。

用通俗的比喻解釋一下AI圖像生成的工作原理：程序首先會設(shè)計兩個角色——一個為生成器，一個為鑒別器。打個比方，有一個瓷器店，瓷器店里做瓷器的小伙子叫小張，我們把他叫生成器，瓷器店除了老板，還有一個伙計是負(fù)責(zé)鑒定的叫老李，我們把他比作鑒別器。有一天老板接了一個訂單，一個客人說要訂一批仿同治年間的青花瓷瓶，大概高50厘米。既然是仿品，就得是一模一樣的。隨后老板就把伙計小張叫來了，讓小張去后場制作，然后又吩咐老李，讓他盯緊，出來的東西一定要和同治年間的花瓶一樣，要符合客人的規(guī)定。這個叫小張的伙計就開始做了，其實他之前也沒做過，也不懂，因為是老板布置的任務(wù)，必須做。鑒定師老李很聰明，跑了圖書館、博物館、大學(xué)，去查資料，然后搞清楚了，積累了1000件青花瓷瓶相關(guān)的資料，知道了青花瓷瓶應(yīng)該做成什么樣的。小張做出來了第一個，老李說這個不對，給我砸了重來。他給小張?zhí)崃撕芏嘁庖?，?yīng)該如何如何，小張按照他的要求再去做第二個。第二個做好后，老李也沒正眼看一下，說還是不行，也給否定掉了，同時也提了很多建議。在這個過程中，小張在不斷地積累經(jīng)驗，兩人經(jīng)過了幾百次的交流、磋商，這么一來一回，終于有一天，小張帶著花瓶再來給老李看，老李一看是這么回事了，說這個可以了，然后拿給老板看，老板說行，我們可以賣了。最后交貨時客戶相當(dāng)滿意，跟同治年間的青花瓷瓶幾乎是一樣的，可以以假亂真了，這個過程就完成了。在這個過程中，我們講的鑒定器，就是老李，老李有1000件的資料，我們叫作數(shù)據(jù)量。如果他有100000件資料的時候，積累的經(jīng)驗、鑒定水平要比1000件時的鑒定水平高得多，也就是說鑒定器是建立在數(shù)據(jù)量基礎(chǔ)上的。同樣小張也有一個積累的過程，兩個人相互訓(xùn)練，隨著訓(xùn)練加深，生成器在生成逼真圖像方面逐漸變強(qiáng)，而辨別器在辨別真?zhèn)紊现饾u變強(qiáng)。當(dāng)辨別器無法區(qū)分真實圖片和偽造圖片時，訓(xùn)練過程達(dá)到平衡。這一套操作系統(tǒng)就叫“生成對抗網(wǎng)絡(luò)”。

相比于AI圖像生成的原理，我們更關(guān)注AI的應(yīng)用。早些時候，我對一些AI圖像生成平臺進(jìn)行了測試，圖像生成從攝影、繪畫、創(chuàng)意、設(shè)計這四種方面進(jìn)行，從陌生到熟練，在得到了大量的圖像和數(shù)據(jù)后，我們來分析一下它們的表現(xiàn)。

在攝影方面，在我給出具體的描述性文本后，AI圖像生成器就可以生成多個高質(zhì)量的圖像，輸出的質(zhì)量取決于我輸入的文本，文本越具體越細(xì)致，圖像的逼真度越高，而這個過程僅僅需要十幾秒的時間。生成的攝影圖片，按攝影的內(nèi)容分類：紀(jì)實攝影、風(fēng)光攝影、動物攝影、植物攝影、人像攝影、工業(yè)攝影、靜物攝影、運動攝影等等，它們可與相機(jī)拍攝的照片相媲美，細(xì)節(jié)、紋理、畫面結(jié)構(gòu)、色彩高度逼真，非常有說服力，如果不注明是AI生成的，基本無法區(qū)分。

繪畫是一項對天賦有所要求、需要日積月累練習(xí)才能習(xí)得的技藝，AI圖像生成可以被簡化成一種與機(jī)器進(jìn)行圖文交互的“盲盒游戲”。所需要做的，就是用文本輸入自己想象中的作品的關(guān)鍵詞，快則十幾秒，AI就能拿出一幅幅不同風(fēng)格和流派的作品。今天AI制造出來的“畫”已經(jīng)達(dá)到很驚人的程度，在我看來已經(jīng)很接近人類繪畫的水平，而AI繪畫的速度，是人類望塵莫及的。

AI在建筑外觀設(shè)計、空間設(shè)計、室內(nèi)裝飾設(shè)計、平面設(shè)計、服裝設(shè)計等領(lǐng)域，同樣有著不俗的表現(xiàn)，可以根據(jù)文本的定義生成大量風(fēng)格和質(zhì)量一致、比較復(fù)雜的圖像，未來一定會成為設(shè)計師的強(qiáng)大工具，并簡化設(shè)計師的工作流程。當(dāng)然，前提條件是設(shè)計師必須熟練使用復(fù)雜、規(guī)范的文本。

而在創(chuàng)意方面，只要有足夠的想象力和靈感，運用合理的文本描述，AI就能解放雙手，生成那些突破現(xiàn)實邏輯的“有趣”回答，圖像獨特而新穎，可以帶來意想不到的驚喜。

AI的圖像生成，是基于人的參與，包括人的創(chuàng)作力、想象力、創(chuàng)作動機(jī)和對最終效果的預(yù)設(shè)等等，在圖像視覺領(lǐng)域，它的能力已超出了我們的預(yù)判。目前，AI圖像生成仍然存在很多局限性，主要表現(xiàn)在：其一，因為數(shù)據(jù)容量和傳輸?shù)膯栴}，目前AI生成圖像的精度不高，遠(yuǎn)遠(yuǎn)達(dá)不到目前主流數(shù)碼相機(jī)和大尺幅打印輸出的像素要求。其二，AI算法是通過分析大型數(shù)據(jù)集來學(xué)習(xí)，高質(zhì)量的、應(yīng)有盡有的數(shù)據(jù)集目前尚不可能，尤其在攝影環(huán)境中，高質(zhì)量圖像可能更難以獲得，所以AI生成的圖像往往會有很大偏差。比如，數(shù)據(jù)集只包含某一種族人群的圖像，那么生成的圖像也會反映這種偏差，就可能會延續(xù)諸如有害的種族偏見和刻板印象等。其三，AI通過人工輸入文本來創(chuàng)建圖像，文本描述的準(zhǔn)確性、詳細(xì)性直接導(dǎo)致圖像生成的精準(zhǔn)，藝術(shù)家需要大量的文本訓(xùn)練。對一些相對簡單的文本，目前AI圖像生成器還不是很精確，在一些意料之外的情況下，程序可能無法充分執(zhí)行。其四，在專業(yè)較強(qiáng)的領(lǐng)域無法保證準(zhǔn)確率。其五，AI算法生成結(jié)果具有不確定性，尤其是對一些細(xì)節(jié)把控不足，這對于創(chuàng)作有著清晰愿景的藝術(shù)家來說，可能會令人沮喪。其六，因為AI生成的圖像是基于預(yù)先存在的數(shù)據(jù)集和學(xué)習(xí)模式，雖然AI可以生成獨特的圖像，但這些圖像缺乏真正的原創(chuàng)性，如果被過度使用，可能導(dǎo)致風(fēng)格同質(zhì)化以及個性的喪失。此外，AI難以修改生成的圖像，并且缺乏具有影響力的情感深度。更為突出的問題是，AI圖像生成過程中，學(xué)習(xí)、參考和借鑒了大量網(wǎng)絡(luò)上已有的圖像，而這些圖像都是有版權(quán)的。AI圖像生成器在學(xué)習(xí)和借鑒前，并沒有得到這些圖像版權(quán)所有人的允許。因此，不能排除潛在的侵犯知識產(chǎn)權(quán)的可能性，無論是否有意。

人類采集信息的目的是為了輸出決策，而輸出的決策跟我們的目標(biāo)是有關(guān)的，還與我們的價值觀有關(guān)。人類整體有一些共性，但每個人都有自己非常獨特的部分，對事物的認(rèn)知是來自于各自人生過去的經(jīng)驗，這里一定會包含某種價值體系，而AI是很難產(chǎn)生真正的價值體系的，所以它只能是我們?nèi)祟愂褂玫墓ぞ?。?dāng)AI來臨的時候，因為它很強(qiáng)大，我們的第一反應(yīng)往往是害怕，所以首先思考的是怎么能不被它取代，或者不被它毀滅。但事實上，當(dāng)人類擁有了如此強(qiáng)大的工具時，可以使人類的文明邁上怎樣的新臺階，哪些工作能得到優(yōu)化和輔助，其實對這種方向的問題更要有所思考，而不僅僅是思考有關(guān)生存的問題。AI和人腦的一個根本區(qū)別在于，它只能從過往獲取“組合式”答案，是對人類社會知識的整理，是在現(xiàn)有知識的基礎(chǔ)上進(jìn)行二次加工的產(chǎn)物，并不能突破人類認(rèn)知的邊界去創(chuàng)造內(nèi)容。雖然說智能機(jī)器人能作“畫”，但它還離不開人發(fā)布的指令，所以，完全離開人，AI還是不能完全獨立制作出圖像來的。

隨著AI技術(shù)的快速提升，AI圖像生成會改變我們創(chuàng)建和消費視覺內(nèi)容的方式，它很快也會成為我們的助手，而將人工智能融入創(chuàng)作過程需要藝術(shù)家角色的積極轉(zhuǎn)變，藝術(shù)家必須學(xué)會與AI算法協(xié)同工作，充分利用人類創(chuàng)造力和AI生成的結(jié)果的優(yōu)勢。

（作者系江蘇省攝協(xié)新文藝群體工作委員會秘書長）

本文圖片均由本文作者蔣澍制作并提供

版權(quán)與免責(zé)聲明：

【聲明】本文轉(zhuǎn)載自其它網(wǎng)絡(luò)媒體，版權(quán)歸原網(wǎng)站及作者所有；本站發(fā)表之圖文，均出于非商業(yè)性的文化交流和大眾鑒賞目的，并不代表贊同其觀點和對其真實性負(fù)責(zé)。如果發(fā)現(xiàn)有涉嫌抄襲或不良信息內(nèi)容，請您告知（電話：17712620144，QQ：476944718，郵件：476944718@qq.com），我們會在第一時間刪除。