時(shí)間:2023/3/31 21:08:08 來源:中國藝術(shù)報(bào)
在今年的全國兩會(huì)上,科技部部長王志剛在兩會(huì)“部長通道”對媒體表示:“ChatGPT之所以引起關(guān)注,在于它作為一個(gè)大模型,有效結(jié)合了大數(shù)據(jù)、大算力、強(qiáng)算法……總的來講,人工智能是大方向、大領(lǐng)域,它的影響絕不僅僅在科技領(lǐng)域本身?!?br>
2022年11月30日,美國OpenAI公司發(fā)布的智能對話大模型產(chǎn)品ChatGPT開始風(fēng)靡全球,僅兩個(gè)月,活躍用戶就超1億,并引發(fā)科技巨頭間的爭奪。而ChatGPT的對話體驗(yàn)引發(fā)人們對AI即人工智能未來能力的重新認(rèn)識,人們對ChatGPT和以ChatGPT為代表的這一波AI新浪潮能做什么極為關(guān)注。如果參照歷史,我們會(huì)看到每次技術(shù)飛躍都會(huì)給社會(huì)帶來巨變,也會(huì)帶來陣痛。AI的發(fā)展,使得我們正站在這樣一個(gè)節(jié)點(diǎn),未來的社會(huì)分工和結(jié)構(gòu)將會(huì)發(fā)生更大的變化,而身處其中的我們都會(huì)被深刻地影響。尤其是在塑造人的精神世界的藝術(shù)領(lǐng)域,處在一個(gè)即將被劇烈顛覆的前臺(tái),文藝從業(yè)者自身必須積極改變以適應(yīng)這樣的一個(gè)位置。
AI進(jìn)軍此前被視為“人類獨(dú)占”的領(lǐng)域——藝術(shù)表達(dá)。最初AI的滲透是緩慢的,但在這半年多時(shí)間可謂逐漸形成了一場搶奪戰(zhàn)。2022年9月,杰森·艾倫在科羅拉多州博覽會(huì)藝術(shù)展上提交了一件名為《太空歌劇院》的藝術(shù)作品,該作品是使用人工智能工具創(chuàng)作的,獲得了數(shù)字藝術(shù)照片類別比賽第一名。允許提交作品的評委并不知道這是人工智能生成的,但在它獲勝并且眾所周知它是由AI生成后,所獲獎(jiǎng)項(xiàng)并沒有被評委撤回。為什么?因?yàn)橹暗囊?guī)則中沒有任何規(guī)定提及AI作品不能參賽,真正的反對來自社交媒體和憤怒的藝術(shù)家,一些人要求艾倫歸還他的獎(jiǎng)項(xiàng)并公開道歉。艾倫的回應(yīng)是:“人工智能是一種工具,就像畫筆是一種工具,工具背后還需要一種創(chuàng)造力。”有更多的人歡迎這種對話,科羅拉多州農(nóng)業(yè)部的傳播總監(jiān)表示,很高興這個(gè)擁有150年歷史的博覽會(huì)成為“討論藝術(shù)的一部分”。這個(gè)新聞事件在這個(gè)歷史時(shí)刻具有特別重要的意義,意味著AI開始對藝術(shù)產(chǎn)生影響。AI作品是否構(gòu)成藝術(shù)?藝術(shù)家受到這種新形式的威脅,是否應(yīng)該接受它?這個(gè)新聞事件可能會(huì)推動(dòng)人工智能生成內(nèi)容(AIGC)作為藝術(shù)的一種形式,并幫助人類的思維轉(zhuǎn)變。
AI圖像生成技術(shù)的工作原理是訓(xùn)練兩個(gè)神經(jīng)網(wǎng)絡(luò):一個(gè)生成新圖像的生成器網(wǎng)絡(luò),一個(gè)試圖區(qū)分真假圖像的鑒別器網(wǎng)絡(luò)。通過這些網(wǎng)絡(luò)之間的競爭和協(xié)作過程,AI可以生成在風(fēng)格和內(nèi)容上與它們接受訓(xùn)練的圖像相似的新圖像,通過文本的輸入,使用計(jì)算機(jī)算法來創(chuàng)建圖像。這種通過文本生成圖像的方式與傳統(tǒng)的圖像生成技術(shù)之間的主要區(qū)別之一是所需的人類參與程度,傳統(tǒng)技術(shù)通常需要大量的手動(dòng)輸入和用戶的專業(yè)知識來創(chuàng)建和完善圖像,而AI圖像生成幾乎不需要人工干預(yù)。
用通俗的比喻解釋一下AI圖像生成的工作原理:程序首先會(huì)設(shè)計(jì)兩個(gè)角色——一個(gè)為生成器,一個(gè)為鑒別器。打個(gè)比方,有一個(gè)瓷器店,瓷器店里做瓷器的小伙子叫小張,我們把他叫生成器,瓷器店除了老板,還有一個(gè)伙計(jì)是負(fù)責(zé)鑒定的叫老李,我們把他比作鑒別器。有一天老板接了一個(gè)訂單,一個(gè)客人說要訂一批仿同治年間的青花瓷瓶,大概高50厘米。既然是仿品,就得是一模一樣的。隨后老板就把伙計(jì)小張叫來了,讓小張去后場制作,然后又吩咐老李,讓他盯緊,出來的東西一定要和同治年間的花瓶一樣,要符合客人的規(guī)定。這個(gè)叫小張的伙計(jì)就開始做了,其實(shí)他之前也沒做過,也不懂,因?yàn)槭抢习宀贾玫娜蝿?wù),必須做。鑒定師老李很聰明,跑了圖書館、博物館、大學(xué),去查資料,然后搞清楚了,積累了1000件青花瓷瓶相關(guān)的資料,知道了青花瓷瓶應(yīng)該做成什么樣的。小張做出來了第一個(gè),老李說這個(gè)不對,給我砸了重來。他給小張?zhí)崃撕芏嘁庖姡瑧?yīng)該如何如何,小張按照他的要求再去做第二個(gè)。第二個(gè)做好后,老李也沒正眼看一下,說還是不行,也給否定掉了,同時(shí)也提了很多建議。在這個(gè)過程中,小張?jiān)诓粩嗟胤e累經(jīng)驗(yàn),兩人經(jīng)過了幾百次的交流、磋商,這么一來一回,終于有一天,小張帶著花瓶再來給老李看,老李一看是這么回事了,說這個(gè)可以了,然后拿給老板看,老板說行,我們可以賣了。最后交貨時(shí)客戶相當(dāng)滿意,跟同治年間的青花瓷瓶幾乎是一樣的,可以以假亂真了,這個(gè)過程就完成了。在這個(gè)過程中,我們講的鑒定器,就是老李,老李有1000件的資料,我們叫作數(shù)據(jù)量。如果他有100000件資料的時(shí)候,積累的經(jīng)驗(yàn)、鑒定水平要比1000件時(shí)的鑒定水平高得多,也就是說鑒定器是建立在數(shù)據(jù)量基礎(chǔ)上的。同樣小張也有一個(gè)積累的過程,兩個(gè)人相互訓(xùn)練,隨著訓(xùn)練加深,生成器在生成逼真圖像方面逐漸變強(qiáng),而辨別器在辨別真?zhèn)紊现饾u變強(qiáng)。當(dāng)辨別器無法區(qū)分真實(shí)圖片和偽造圖片時(shí),訓(xùn)練過程達(dá)到平衡。這一套操作系統(tǒng)就叫“生成對抗網(wǎng)絡(luò)”。
相比于AI圖像生成的原理,我們更關(guān)注AI的應(yīng)用。早些時(shí)候,我對一些AI圖像生成平臺(tái)進(jìn)行了測試,圖像生成從攝影、繪畫、創(chuàng)意、設(shè)計(jì)這四種方面進(jìn)行,從陌生到熟練,在得到了大量的圖像和數(shù)據(jù)后,我們來分析一下它們的表現(xiàn)。
在攝影方面,在我給出具體的描述性文本后,AI圖像生成器就可以生成多個(gè)高質(zhì)量的圖像,輸出的質(zhì)量取決于我輸入的文本,文本越具體越細(xì)致,圖像的逼真度越高,而這個(gè)過程僅僅需要十幾秒的時(shí)間。生成的攝影圖片,按攝影的內(nèi)容分類:紀(jì)實(shí)攝影、風(fēng)光攝影、動(dòng)物攝影、植物攝影、人像攝影、工業(yè)攝影、靜物攝影、運(yùn)動(dòng)攝影等等,它們可與相機(jī)拍攝的照片相媲美,細(xì)節(jié)、紋理、畫面結(jié)構(gòu)、色彩高度逼真,非常有說服力,如果不注明是AI生成的,基本無法區(qū)分。
繪畫是一項(xiàng)對天賦有所要求、需要日積月累練習(xí)才能習(xí)得的技藝,AI圖像生成可以被簡化成一種與機(jī)器進(jìn)行圖文交互的“盲盒游戲”。所需要做的,就是用文本輸入自己想象中的作品的關(guān)鍵詞,快則十幾秒,AI就能拿出一幅幅不同風(fēng)格和流派的作品。今天AI制造出來的“畫”已經(jīng)達(dá)到很驚人的程度,在我看來已經(jīng)很接近人類繪畫的水平,而AI繪畫的速度,是人類望塵莫及的。
AI在建筑外觀設(shè)計(jì)、空間設(shè)計(jì)、室內(nèi)裝飾設(shè)計(jì)、平面設(shè)計(jì)、服裝設(shè)計(jì)等領(lǐng)域,同樣有著不俗的表現(xiàn),可以根據(jù)文本的定義生成大量風(fēng)格和質(zhì)量一致、比較復(fù)雜的圖像,未來一定會(huì)成為設(shè)計(jì)師的強(qiáng)大工具,并簡化設(shè)計(jì)師的工作流程。當(dāng)然,前提條件是設(shè)計(jì)師必須熟練使用復(fù)雜、規(guī)范的文本。
而在創(chuàng)意方面,只要有足夠的想象力和靈感,運(yùn)用合理的文本描述,AI就能解放雙手,生成那些突破現(xiàn)實(shí)邏輯的“有趣”回答,圖像獨(dú)特而新穎,可以帶來意想不到的驚喜。
AI的圖像生成,是基于人的參與,包括人的創(chuàng)作力、想象力、創(chuàng)作動(dòng)機(jī)和對最終效果的預(yù)設(shè)等等,在圖像視覺領(lǐng)域,它的能力已超出了我們的預(yù)判。目前,AI圖像生成仍然存在很多局限性,主要表現(xiàn)在:其一,因?yàn)閿?shù)據(jù)容量和傳輸?shù)膯栴},目前AI生成圖像的精度不高,遠(yuǎn)遠(yuǎn)達(dá)不到目前主流數(shù)碼相機(jī)和大尺幅打印輸出的像素要求。其二,AI算法是通過分析大型數(shù)據(jù)集來學(xué)習(xí),高質(zhì)量的、應(yīng)有盡有的數(shù)據(jù)集目前尚不可能,尤其在攝影環(huán)境中,高質(zhì)量圖像可能更難以獲得,所以AI生成的圖像往往會(huì)有很大偏差。比如,數(shù)據(jù)集只包含某一種族人群的圖像,那么生成的圖像也會(huì)反映這種偏差,就可能會(huì)延續(xù)諸如有害的種族偏見和刻板印象等。其三,AI通過人工輸入文本來創(chuàng)建圖像,文本描述的準(zhǔn)確性、詳細(xì)性直接導(dǎo)致圖像生成的精準(zhǔn),藝術(shù)家需要大量的文本訓(xùn)練。對一些相對簡單的文本,目前AI圖像生成器還不是很精確,在一些意料之外的情況下,程序可能無法充分執(zhí)行。其四,在專業(yè)較強(qiáng)的領(lǐng)域無法保證準(zhǔn)確率。其五,AI算法生成結(jié)果具有不確定性,尤其是對一些細(xì)節(jié)把控不足,這對于創(chuàng)作有著清晰愿景的藝術(shù)家來說,可能會(huì)令人沮喪。其六,因?yàn)锳I生成的圖像是基于預(yù)先存在的數(shù)據(jù)集和學(xué)習(xí)模式,雖然AI可以生成獨(dú)特的圖像,但這些圖像缺乏真正的原創(chuàng)性,如果被過度使用,可能導(dǎo)致風(fēng)格同質(zhì)化以及個(gè)性的喪失。此外,AI難以修改生成的圖像,并且缺乏具有影響力的情感深度。更為突出的問題是,AI圖像生成過程中,學(xué)習(xí)、參考和借鑒了大量網(wǎng)絡(luò)上已有的圖像,而這些圖像都是有版權(quán)的。AI圖像生成器在學(xué)習(xí)和借鑒前,并沒有得到這些圖像版權(quán)所有人的允許。因此,不能排除潛在的侵犯知識產(chǎn)權(quán)的可能性,無論是否有意。
人類采集信息的目的是為了輸出決策,而輸出的決策跟我們的目標(biāo)是有關(guān)的,還與我們的價(jià)值觀有關(guān)。人類整體有一些共性,但每個(gè)人都有自己非常獨(dú)特的部分,對事物的認(rèn)知是來自于各自人生過去的經(jīng)驗(yàn),這里一定會(huì)包含某種價(jià)值體系,而AI是很難產(chǎn)生真正的價(jià)值體系的,所以它只能是我們?nèi)祟愂褂玫墓ぞ?。?dāng)AI來臨的時(shí)候,因?yàn)樗軓?qiáng)大,我們的第一反應(yīng)往往是害怕,所以首先思考的是怎么能不被它取代,或者不被它毀滅。但事實(shí)上,當(dāng)人類擁有了如此強(qiáng)大的工具時(shí),可以使人類的文明邁上怎樣的新臺(tái)階,哪些工作能得到優(yōu)化和輔助,其實(shí)對這種方向的問題更要有所思考,而不僅僅是思考有關(guān)生存的問題。AI和人腦的一個(gè)根本區(qū)別在于,它只能從過往獲取“組合式”答案,是對人類社會(huì)知識的整理,是在現(xiàn)有知識的基礎(chǔ)上進(jìn)行二次加工的產(chǎn)物,并不能突破人類認(rèn)知的邊界去創(chuàng)造內(nèi)容。雖然說智能機(jī)器人能作“畫”,但它還離不開人發(fā)布的指令,所以,完全離開人,AI還是不能完全獨(dú)立制作出圖像來的。
隨著AI技術(shù)的快速提升,AI圖像生成會(huì)改變我們創(chuàng)建和消費(fèi)視覺內(nèi)容的方式,它很快也會(huì)成為我們的助手,而將人工智能融入創(chuàng)作過程需要藝術(shù)家角色的積極轉(zhuǎn)變,藝術(shù)家必須學(xué)會(huì)與AI算法協(xié)同工作,充分利用人類創(chuàng)造力和AI生成的結(jié)果的優(yōu)勢。
(作者系江蘇省攝協(xié)新文藝群體工作委員會(huì)秘書長)
本文圖片均由本文作者蔣澍制作并提供
滬公網(wǎng)安備 31010102006431號 |