時(shí)間:2023/3/31 21:08:08 來(lái)源:中國(guó)藝術(shù)報(bào)
在今年的全國(guó)兩會(huì)上,科技部部長(zhǎng)王志剛在兩會(huì)“部長(zhǎng)通道”對(duì)媒體表示:“ChatGPT之所以引起關(guān)注,在于它作為一個(gè)大模型,有效結(jié)合了大數(shù)據(jù)、大算力、強(qiáng)算法……總的來(lái)講,人工智能是大方向、大領(lǐng)域,它的影響絕不僅僅在科技領(lǐng)域本身。”
2022年11月30日,美國(guó)OpenAI公司發(fā)布的智能對(duì)話大模型產(chǎn)品ChatGPT開(kāi)始風(fēng)靡全球,僅兩個(gè)月,活躍用戶就超1億,并引發(fā)科技巨頭間的爭(zhēng)奪。而ChatGPT的對(duì)話體驗(yàn)引發(fā)人們對(duì)AI即人工智能未來(lái)能力的重新認(rèn)識(shí),人們對(duì)ChatGPT和以ChatGPT為代表的這一波AI新浪潮能做什么極為關(guān)注。如果參照歷史,我們會(huì)看到每次技術(shù)飛躍都會(huì)給社會(huì)帶來(lái)巨變,也會(huì)帶來(lái)陣痛。AI的發(fā)展,使得我們正站在這樣一個(gè)節(jié)點(diǎn),未來(lái)的社會(huì)分工和結(jié)構(gòu)將會(huì)發(fā)生更大的變化,而身處其中的我們都會(huì)被深刻地影響。尤其是在塑造人的精神世界的藝術(shù)領(lǐng)域,處在一個(gè)即將被劇烈顛覆的前臺(tái),文藝從業(yè)者自身必須積極改變以適應(yīng)這樣的一個(gè)位置。
AI進(jìn)軍此前被視為“人類(lèi)獨(dú)占”的領(lǐng)域——藝術(shù)表達(dá)。最初AI的滲透是緩慢的,但在這半年多時(shí)間可謂逐漸形成了一場(chǎng)搶奪戰(zhàn)。2022年9月,杰森·艾倫在科羅拉多州博覽會(huì)藝術(shù)展上提交了一件名為《太空歌劇院》的藝術(shù)作品,該作品是使用人工智能工具創(chuàng)作的,獲得了數(shù)字藝術(shù)照片類(lèi)別比賽第一名。允許提交作品的評(píng)委并不知道這是人工智能生成的,但在它獲勝并且眾所周知它是由AI生成后,所獲獎(jiǎng)項(xiàng)并沒(méi)有被評(píng)委撤回。為什么?因?yàn)橹暗囊?guī)則中沒(méi)有任何規(guī)定提及AI作品不能參賽,真正的反對(duì)來(lái)自社交媒體和憤怒的藝術(shù)家,一些人要求艾倫歸還他的獎(jiǎng)項(xiàng)并公開(kāi)道歉。艾倫的回應(yīng)是:“人工智能是一種工具,就像畫(huà)筆是一種工具,工具背后還需要一種創(chuàng)造力?!庇懈嗟娜藲g迎這種對(duì)話,科羅拉多州農(nóng)業(yè)部的傳播總監(jiān)表示,很高興這個(gè)擁有150年歷史的博覽會(huì)成為“討論藝術(shù)的一部分”。這個(gè)新聞事件在這個(gè)歷史時(shí)刻具有特別重要的意義,意味著AI開(kāi)始對(duì)藝術(shù)產(chǎn)生影響。AI作品是否構(gòu)成藝術(shù)?藝術(shù)家受到這種新形式的威脅,是否應(yīng)該接受它?這個(gè)新聞事件可能會(huì)推動(dòng)人工智能生成內(nèi)容(AIGC)作為藝術(shù)的一種形式,并幫助人類(lèi)的思維轉(zhuǎn)變。
AI圖像生成技術(shù)的工作原理是訓(xùn)練兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)生成新圖像的生成器網(wǎng)絡(luò),一個(gè)試圖區(qū)分真假圖像的鑒別器網(wǎng)絡(luò)。通過(guò)這些網(wǎng)絡(luò)之間的競(jìng)爭(zhēng)和協(xié)作過(guò)程,AI可以生成在風(fēng)格和內(nèi)容上與它們接受訓(xùn)練的圖像相似的新圖像,通過(guò)文本的輸入,使用計(jì)算機(jī)算法來(lái)創(chuàng)建圖像。這種通過(guò)文本生成圖像的方式與傳統(tǒng)的圖像生成技術(shù)之間的主要區(qū)別之一是所需的人類(lèi)參與程度,傳統(tǒng)技術(shù)通常需要大量的手動(dòng)輸入和用戶的專業(yè)知識(shí)來(lái)創(chuàng)建和完善圖像,而AI圖像生成幾乎不需要人工干預(yù)。
用通俗的比喻解釋一下AI圖像生成的工作原理:程序首先會(huì)設(shè)計(jì)兩個(gè)角色——一個(gè)為生成器,一個(gè)為鑒別器。打個(gè)比方,有一個(gè)瓷器店,瓷器店里做瓷器的小伙子叫小張,我們把他叫生成器,瓷器店除了老板,還有一個(gè)伙計(jì)是負(fù)責(zé)鑒定的叫老李,我們把他比作鑒別器。有一天老板接了一個(gè)訂單,一個(gè)客人說(shuō)要訂一批仿同治年間的青花瓷瓶,大概高50厘米。既然是仿品,就得是一模一樣的。隨后老板就把伙計(jì)小張叫來(lái)了,讓小張去后場(chǎng)制作,然后又吩咐老李,讓他盯緊,出來(lái)的東西一定要和同治年間的花瓶一樣,要符合客人的規(guī)定。這個(gè)叫小張的伙計(jì)就開(kāi)始做了,其實(shí)他之前也沒(méi)做過(guò),也不懂,因?yàn)槭抢习宀贾玫娜蝿?wù),必須做。鑒定師老李很聰明,跑了圖書(shū)館、博物館、大學(xué),去查資料,然后搞清楚了,積累了1000件青花瓷瓶相關(guān)的資料,知道了青花瓷瓶應(yīng)該做成什么樣的。小張做出來(lái)了第一個(gè),老李說(shuō)這個(gè)不對(duì),給我砸了重來(lái)。他給小張?zhí)崃撕芏嘁庖?jiàn),應(yīng)該如何如何,小張按照他的要求再去做第二個(gè)。第二個(gè)做好后,老李也沒(méi)正眼看一下,說(shuō)還是不行,也給否定掉了,同時(shí)也提了很多建議。在這個(gè)過(guò)程中,小張?jiān)诓粩嗟胤e累經(jīng)驗(yàn),兩人經(jīng)過(guò)了幾百次的交流、磋商,這么一來(lái)一回,終于有一天,小張帶著花瓶再來(lái)給老李看,老李一看是這么回事了,說(shuō)這個(gè)可以了,然后拿給老板看,老板說(shuō)行,我們可以賣(mài)了。最后交貨時(shí)客戶相當(dāng)滿意,跟同治年間的青花瓷瓶幾乎是一樣的,可以以假亂真了,這個(gè)過(guò)程就完成了。在這個(gè)過(guò)程中,我們講的鑒定器,就是老李,老李有1000件的資料,我們叫作數(shù)據(jù)量。如果他有100000件資料的時(shí)候,積累的經(jīng)驗(yàn)、鑒定水平要比1000件時(shí)的鑒定水平高得多,也就是說(shuō)鑒定器是建立在數(shù)據(jù)量基礎(chǔ)上的。同樣小張也有一個(gè)積累的過(guò)程,兩個(gè)人相互訓(xùn)練,隨著訓(xùn)練加深,生成器在生成逼真圖像方面逐漸變強(qiáng),而辨別器在辨別真?zhèn)紊现饾u變強(qiáng)。當(dāng)辨別器無(wú)法區(qū)分真實(shí)圖片和偽造圖片時(shí),訓(xùn)練過(guò)程達(dá)到平衡。這一套操作系統(tǒng)就叫“生成對(duì)抗網(wǎng)絡(luò)”。
相比于AI圖像生成的原理,我們更關(guān)注AI的應(yīng)用。早些時(shí)候,我對(duì)一些AI圖像生成平臺(tái)進(jìn)行了測(cè)試,圖像生成從攝影、繪畫(huà)、創(chuàng)意、設(shè)計(jì)這四種方面進(jìn)行,從陌生到熟練,在得到了大量的圖像和數(shù)據(jù)后,我們來(lái)分析一下它們的表現(xiàn)。
在攝影方面,在我給出具體的描述性文本后,AI圖像生成器就可以生成多個(gè)高質(zhì)量的圖像,輸出的質(zhì)量取決于我輸入的文本,文本越具體越細(xì)致,圖像的逼真度越高,而這個(gè)過(guò)程僅僅需要十幾秒的時(shí)間。生成的攝影圖片,按攝影的內(nèi)容分類(lèi):紀(jì)實(shí)攝影、風(fēng)光攝影、動(dòng)物攝影、植物攝影、人像攝影、工業(yè)攝影、靜物攝影、運(yùn)動(dòng)攝影等等,它們可與相機(jī)拍攝的照片相媲美,細(xì)節(jié)、紋理、畫(huà)面結(jié)構(gòu)、色彩高度逼真,非常有說(shuō)服力,如果不注明是AI生成的,基本無(wú)法區(qū)分。
繪畫(huà)是一項(xiàng)對(duì)天賦有所要求、需要日積月累練習(xí)才能習(xí)得的技藝,AI圖像生成可以被簡(jiǎn)化成一種與機(jī)器進(jìn)行圖文交互的“盲盒游戲”。所需要做的,就是用文本輸入自己想象中的作品的關(guān)鍵詞,快則十幾秒,AI就能拿出一幅幅不同風(fēng)格和流派的作品。今天AI制造出來(lái)的“畫(huà)”已經(jīng)達(dá)到很驚人的程度,在我看來(lái)已經(jīng)很接近人類(lèi)繪畫(huà)的水平,而AI繪畫(huà)的速度,是人類(lèi)望塵莫及的。
AI在建筑外觀設(shè)計(jì)、空間設(shè)計(jì)、室內(nèi)裝飾設(shè)計(jì)、平面設(shè)計(jì)、服裝設(shè)計(jì)等領(lǐng)域,同樣有著不俗的表現(xiàn),可以根據(jù)文本的定義生成大量風(fēng)格和質(zhì)量一致、比較復(fù)雜的圖像,未來(lái)一定會(huì)成為設(shè)計(jì)師的強(qiáng)大工具,并簡(jiǎn)化設(shè)計(jì)師的工作流程。當(dāng)然,前提條件是設(shè)計(jì)師必須熟練使用復(fù)雜、規(guī)范的文本。
而在創(chuàng)意方面,只要有足夠的想象力和靈感,運(yùn)用合理的文本描述,AI就能解放雙手,生成那些突破現(xiàn)實(shí)邏輯的“有趣”回答,圖像獨(dú)特而新穎,可以帶來(lái)意想不到的驚喜。
AI的圖像生成,是基于人的參與,包括人的創(chuàng)作力、想象力、創(chuàng)作動(dòng)機(jī)和對(duì)最終效果的預(yù)設(shè)等等,在圖像視覺(jué)領(lǐng)域,它的能力已超出了我們的預(yù)判。目前,AI圖像生成仍然存在很多局限性,主要表現(xiàn)在:其一,因?yàn)閿?shù)據(jù)容量和傳輸?shù)膯?wèn)題,目前AI生成圖像的精度不高,遠(yuǎn)遠(yuǎn)達(dá)不到目前主流數(shù)碼相機(jī)和大尺幅打印輸出的像素要求。其二,AI算法是通過(guò)分析大型數(shù)據(jù)集來(lái)學(xué)習(xí),高質(zhì)量的、應(yīng)有盡有的數(shù)據(jù)集目前尚不可能,尤其在攝影環(huán)境中,高質(zhì)量圖像可能更難以獲得,所以AI生成的圖像往往會(huì)有很大偏差。比如,數(shù)據(jù)集只包含某一種族人群的圖像,那么生成的圖像也會(huì)反映這種偏差,就可能會(huì)延續(xù)諸如有害的種族偏見(jiàn)和刻板印象等。其三,AI通過(guò)人工輸入文本來(lái)創(chuàng)建圖像,文本描述的準(zhǔn)確性、詳細(xì)性直接導(dǎo)致圖像生成的精準(zhǔn),藝術(shù)家需要大量的文本訓(xùn)練。對(duì)一些相對(duì)簡(jiǎn)單的文本,目前AI圖像生成器還不是很精確,在一些意料之外的情況下,程序可能無(wú)法充分執(zhí)行。其四,在專業(yè)較強(qiáng)的領(lǐng)域無(wú)法保證準(zhǔn)確率。其五,AI算法生成結(jié)果具有不確定性,尤其是對(duì)一些細(xì)節(jié)把控不足,這對(duì)于創(chuàng)作有著清晰愿景的藝術(shù)家來(lái)說(shuō),可能會(huì)令人沮喪。其六,因?yàn)锳I生成的圖像是基于預(yù)先存在的數(shù)據(jù)集和學(xué)習(xí)模式,雖然AI可以生成獨(dú)特的圖像,但這些圖像缺乏真正的原創(chuàng)性,如果被過(guò)度使用,可能導(dǎo)致風(fēng)格同質(zhì)化以及個(gè)性的喪失。此外,AI難以修改生成的圖像,并且缺乏具有影響力的情感深度。更為突出的問(wèn)題是,AI圖像生成過(guò)程中,學(xué)習(xí)、參考和借鑒了大量網(wǎng)絡(luò)上已有的圖像,而這些圖像都是有版權(quán)的。AI圖像生成器在學(xué)習(xí)和借鑒前,并沒(méi)有得到這些圖像版權(quán)所有人的允許。因此,不能排除潛在的侵犯知識(shí)產(chǎn)權(quán)的可能性,無(wú)論是否有意。
人類(lèi)采集信息的目的是為了輸出決策,而輸出的決策跟我們的目標(biāo)是有關(guān)的,還與我們的價(jià)值觀有關(guān)。人類(lèi)整體有一些共性,但每個(gè)人都有自己非常獨(dú)特的部分,對(duì)事物的認(rèn)知是來(lái)自于各自人生過(guò)去的經(jīng)驗(yàn),這里一定會(huì)包含某種價(jià)值體系,而AI是很難產(chǎn)生真正的價(jià)值體系的,所以它只能是我們?nèi)祟?lèi)使用的工具。當(dāng)AI來(lái)臨的時(shí)候,因?yàn)樗軓?qiáng)大,我們的第一反應(yīng)往往是害怕,所以首先思考的是怎么能不被它取代,或者不被它毀滅。但事實(shí)上,當(dāng)人類(lèi)擁有了如此強(qiáng)大的工具時(shí),可以使人類(lèi)的文明邁上怎樣的新臺(tái)階,哪些工作能得到優(yōu)化和輔助,其實(shí)對(duì)這種方向的問(wèn)題更要有所思考,而不僅僅是思考有關(guān)生存的問(wèn)題。AI和人腦的一個(gè)根本區(qū)別在于,它只能從過(guò)往獲取“組合式”答案,是對(duì)人類(lèi)社會(huì)知識(shí)的整理,是在現(xiàn)有知識(shí)的基礎(chǔ)上進(jìn)行二次加工的產(chǎn)物,并不能突破人類(lèi)認(rèn)知的邊界去創(chuàng)造內(nèi)容。雖然說(shuō)智能機(jī)器人能作“畫(huà)”,但它還離不開(kāi)人發(fā)布的指令,所以,完全離開(kāi)人,AI還是不能完全獨(dú)立制作出圖像來(lái)的。
隨著AI技術(shù)的快速提升,AI圖像生成會(huì)改變我們創(chuàng)建和消費(fèi)視覺(jué)內(nèi)容的方式,它很快也會(huì)成為我們的助手,而將人工智能融入創(chuàng)作過(guò)程需要藝術(shù)家角色的積極轉(zhuǎn)變,藝術(shù)家必須學(xué)會(huì)與AI算法協(xié)同工作,充分利用人類(lèi)創(chuàng)造力和AI生成的結(jié)果的優(yōu)勢(shì)。
(作者系江蘇省攝協(xié)新文藝群體工作委員會(huì)秘書(shū)長(zhǎng))
本文圖片均由本文作者蔣澍制作并提供
滬公網(wǎng)安備 31010102006431號(hào) |