時間:2023/3/31 21:08:08 來源:中國藝術(shù)報
在今年的全國兩會上,科技部部長王志剛在兩會“部長通道”對媒體表示:“ChatGPT之所以引起關(guān)注,在于它作為一個大模型,有效結(jié)合了大數(shù)據(jù)、大算力、強(qiáng)算法……總的來講,人工智能是大方向、大領(lǐng)域,它的影響絕不僅僅在科技領(lǐng)域本身?!?br>
2022年11月30日,美國OpenAI公司發(fā)布的智能對話大模型產(chǎn)品ChatGPT開始風(fēng)靡全球,僅兩個月,活躍用戶就超1億,并引發(fā)科技巨頭間的爭奪。而ChatGPT的對話體驗引發(fā)人們對AI即人工智能未來能力的重新認(rèn)識,人們對ChatGPT和以ChatGPT為代表的這一波AI新浪潮能做什么極為關(guān)注。如果參照歷史,我們會看到每次技術(shù)飛躍都會給社會帶來巨變,也會帶來陣痛。AI的發(fā)展,使得我們正站在這樣一個節(jié)點,未來的社會分工和結(jié)構(gòu)將會發(fā)生更大的變化,而身處其中的我們都會被深刻地影響。尤其是在塑造人的精神世界的藝術(shù)領(lǐng)域,處在一個即將被劇烈顛覆的前臺,文藝從業(yè)者自身必須積極改變以適應(yīng)這樣的一個位置。
AI進(jìn)軍此前被視為“人類獨占”的領(lǐng)域——藝術(shù)表達(dá)。最初AI的滲透是緩慢的,但在這半年多時間可謂逐漸形成了一場搶奪戰(zhàn)。2022年9月,杰森·艾倫在科羅拉多州博覽會藝術(shù)展上提交了一件名為《太空歌劇院》的藝術(shù)作品,該作品是使用人工智能工具創(chuàng)作的,獲得了數(shù)字藝術(shù)照片類別比賽第一名。允許提交作品的評委并不知道這是人工智能生成的,但在它獲勝并且眾所周知它是由AI生成后,所獲獎項并沒有被評委撤回。為什么?因為之前的規(guī)則中沒有任何規(guī)定提及AI作品不能參賽,真正的反對來自社交媒體和憤怒的藝術(shù)家,一些人要求艾倫歸還他的獎項并公開道歉。艾倫的回應(yīng)是:“人工智能是一種工具,就像畫筆是一種工具,工具背后還需要一種創(chuàng)造力?!庇懈嗟娜藲g迎這種對話,科羅拉多州農(nóng)業(yè)部的傳播總監(jiān)表示,很高興這個擁有150年歷史的博覽會成為“討論藝術(shù)的一部分”。這個新聞事件在這個歷史時刻具有特別重要的意義,意味著AI開始對藝術(shù)產(chǎn)生影響。AI作品是否構(gòu)成藝術(shù)?藝術(shù)家受到這種新形式的威脅,是否應(yīng)該接受它?這個新聞事件可能會推動人工智能生成內(nèi)容(AIGC)作為藝術(shù)的一種形式,并幫助人類的思維轉(zhuǎn)變。
AI圖像生成技術(shù)的工作原理是訓(xùn)練兩個神經(jīng)網(wǎng)絡(luò):一個生成新圖像的生成器網(wǎng)絡(luò),一個試圖區(qū)分真假圖像的鑒別器網(wǎng)絡(luò)。通過這些網(wǎng)絡(luò)之間的競爭和協(xié)作過程,AI可以生成在風(fēng)格和內(nèi)容上與它們接受訓(xùn)練的圖像相似的新圖像,通過文本的輸入,使用計算機(jī)算法來創(chuàng)建圖像。這種通過文本生成圖像的方式與傳統(tǒng)的圖像生成技術(shù)之間的主要區(qū)別之一是所需的人類參與程度,傳統(tǒng)技術(shù)通常需要大量的手動輸入和用戶的專業(yè)知識來創(chuàng)建和完善圖像,而AI圖像生成幾乎不需要人工干預(yù)。
用通俗的比喻解釋一下AI圖像生成的工作原理:程序首先會設(shè)計兩個角色——一個為生成器,一個為鑒別器。打個比方,有一個瓷器店,瓷器店里做瓷器的小伙子叫小張,我們把他叫生成器,瓷器店除了老板,還有一個伙計是負(fù)責(zé)鑒定的叫老李,我們把他比作鑒別器。有一天老板接了一個訂單,一個客人說要訂一批仿同治年間的青花瓷瓶,大概高50厘米。既然是仿品,就得是一模一樣的。隨后老板就把伙計小張叫來了,讓小張去后場制作,然后又吩咐老李,讓他盯緊,出來的東西一定要和同治年間的花瓶一樣,要符合客人的規(guī)定。這個叫小張的伙計就開始做了,其實他之前也沒做過,也不懂,因為是老板布置的任務(wù),必須做。鑒定師老李很聰明,跑了圖書館、博物館、大學(xué),去查資料,然后搞清楚了,積累了1000件青花瓷瓶相關(guān)的資料,知道了青花瓷瓶應(yīng)該做成什么樣的。小張做出來了第一個,老李說這個不對,給我砸了重來。他給小張?zhí)崃撕芏嘁庖?,?yīng)該如何如何,小張按照他的要求再去做第二個。第二個做好后,老李也沒正眼看一下,說還是不行,也給否定掉了,同時也提了很多建議。在這個過程中,小張在不斷地積累經(jīng)驗,兩人經(jīng)過了幾百次的交流、磋商,這么一來一回,終于有一天,小張帶著花瓶再來給老李看,老李一看是這么回事了,說這個可以了,然后拿給老板看,老板說行,我們可以賣了。最后交貨時客戶相當(dāng)滿意,跟同治年間的青花瓷瓶幾乎是一樣的,可以以假亂真了,這個過程就完成了。在這個過程中,我們講的鑒定器,就是老李,老李有1000件的資料,我們叫作數(shù)據(jù)量。如果他有100000件資料的時候,積累的經(jīng)驗、鑒定水平要比1000件時的鑒定水平高得多,也就是說鑒定器是建立在數(shù)據(jù)量基礎(chǔ)上的。同樣小張也有一個積累的過程,兩個人相互訓(xùn)練,隨著訓(xùn)練加深,生成器在生成逼真圖像方面逐漸變強(qiáng),而辨別器在辨別真?zhèn)紊现饾u變強(qiáng)。當(dāng)辨別器無法區(qū)分真實圖片和偽造圖片時,訓(xùn)練過程達(dá)到平衡。這一套操作系統(tǒng)就叫“生成對抗網(wǎng)絡(luò)”。
相比于AI圖像生成的原理,我們更關(guān)注AI的應(yīng)用。早些時候,我對一些AI圖像生成平臺進(jìn)行了測試,圖像生成從攝影、繪畫、創(chuàng)意、設(shè)計這四種方面進(jìn)行,從陌生到熟練,在得到了大量的圖像和數(shù)據(jù)后,我們來分析一下它們的表現(xiàn)。
在攝影方面,在我給出具體的描述性文本后,AI圖像生成器就可以生成多個高質(zhì)量的圖像,輸出的質(zhì)量取決于我輸入的文本,文本越具體越細(xì)致,圖像的逼真度越高,而這個過程僅僅需要十幾秒的時間。生成的攝影圖片,按攝影的內(nèi)容分類:紀(jì)實攝影、風(fēng)光攝影、動物攝影、植物攝影、人像攝影、工業(yè)攝影、靜物攝影、運動攝影等等,它們可與相機(jī)拍攝的照片相媲美,細(xì)節(jié)、紋理、畫面結(jié)構(gòu)、色彩高度逼真,非常有說服力,如果不注明是AI生成的,基本無法區(qū)分。
繪畫是一項對天賦有所要求、需要日積月累練習(xí)才能習(xí)得的技藝,AI圖像生成可以被簡化成一種與機(jī)器進(jìn)行圖文交互的“盲盒游戲”。所需要做的,就是用文本輸入自己想象中的作品的關(guān)鍵詞,快則十幾秒,AI就能拿出一幅幅不同風(fēng)格和流派的作品。今天AI制造出來的“畫”已經(jīng)達(dá)到很驚人的程度,在我看來已經(jīng)很接近人類繪畫的水平,而AI繪畫的速度,是人類望塵莫及的。
AI在建筑外觀設(shè)計、空間設(shè)計、室內(nèi)裝飾設(shè)計、平面設(shè)計、服裝設(shè)計等領(lǐng)域,同樣有著不俗的表現(xiàn),可以根據(jù)文本的定義生成大量風(fēng)格和質(zhì)量一致、比較復(fù)雜的圖像,未來一定會成為設(shè)計師的強(qiáng)大工具,并簡化設(shè)計師的工作流程。當(dāng)然,前提條件是設(shè)計師必須熟練使用復(fù)雜、規(guī)范的文本。
而在創(chuàng)意方面,只要有足夠的想象力和靈感,運用合理的文本描述,AI就能解放雙手,生成那些突破現(xiàn)實邏輯的“有趣”回答,圖像獨特而新穎,可以帶來意想不到的驚喜。
AI的圖像生成,是基于人的參與,包括人的創(chuàng)作力、想象力、創(chuàng)作動機(jī)和對最終效果的預(yù)設(shè)等等,在圖像視覺領(lǐng)域,它的能力已超出了我們的預(yù)判。目前,AI圖像生成仍然存在很多局限性,主要表現(xiàn)在:其一,因為數(shù)據(jù)容量和傳輸?shù)膯栴},目前AI生成圖像的精度不高,遠(yuǎn)遠(yuǎn)達(dá)不到目前主流數(shù)碼相機(jī)和大尺幅打印輸出的像素要求。其二,AI算法是通過分析大型數(shù)據(jù)集來學(xué)習(xí),高質(zhì)量的、應(yīng)有盡有的數(shù)據(jù)集目前尚不可能,尤其在攝影環(huán)境中,高質(zhì)量圖像可能更難以獲得,所以AI生成的圖像往往會有很大偏差。比如,數(shù)據(jù)集只包含某一種族人群的圖像,那么生成的圖像也會反映這種偏差,就可能會延續(xù)諸如有害的種族偏見和刻板印象等。其三,AI通過人工輸入文本來創(chuàng)建圖像,文本描述的準(zhǔn)確性、詳細(xì)性直接導(dǎo)致圖像生成的精準(zhǔn),藝術(shù)家需要大量的文本訓(xùn)練。對一些相對簡單的文本,目前AI圖像生成器還不是很精確,在一些意料之外的情況下,程序可能無法充分執(zhí)行。其四,在專業(yè)較強(qiáng)的領(lǐng)域無法保證準(zhǔn)確率。其五,AI算法生成結(jié)果具有不確定性,尤其是對一些細(xì)節(jié)把控不足,這對于創(chuàng)作有著清晰愿景的藝術(shù)家來說,可能會令人沮喪。其六,因為AI生成的圖像是基于預(yù)先存在的數(shù)據(jù)集和學(xué)習(xí)模式,雖然AI可以生成獨特的圖像,但這些圖像缺乏真正的原創(chuàng)性,如果被過度使用,可能導(dǎo)致風(fēng)格同質(zhì)化以及個性的喪失。此外,AI難以修改生成的圖像,并且缺乏具有影響力的情感深度。更為突出的問題是,AI圖像生成過程中,學(xué)習(xí)、參考和借鑒了大量網(wǎng)絡(luò)上已有的圖像,而這些圖像都是有版權(quán)的。AI圖像生成器在學(xué)習(xí)和借鑒前,并沒有得到這些圖像版權(quán)所有人的允許。因此,不能排除潛在的侵犯知識產(chǎn)權(quán)的可能性,無論是否有意。
人類采集信息的目的是為了輸出決策,而輸出的決策跟我們的目標(biāo)是有關(guān)的,還與我們的價值觀有關(guān)。人類整體有一些共性,但每個人都有自己非常獨特的部分,對事物的認(rèn)知是來自于各自人生過去的經(jīng)驗,這里一定會包含某種價值體系,而AI是很難產(chǎn)生真正的價值體系的,所以它只能是我們?nèi)祟愂褂玫墓ぞ?。?dāng)AI來臨的時候,因為它很強(qiáng)大,我們的第一反應(yīng)往往是害怕,所以首先思考的是怎么能不被它取代,或者不被它毀滅。但事實上,當(dāng)人類擁有了如此強(qiáng)大的工具時,可以使人類的文明邁上怎樣的新臺階,哪些工作能得到優(yōu)化和輔助,其實對這種方向的問題更要有所思考,而不僅僅是思考有關(guān)生存的問題。AI和人腦的一個根本區(qū)別在于,它只能從過往獲取“組合式”答案,是對人類社會知識的整理,是在現(xiàn)有知識的基礎(chǔ)上進(jìn)行二次加工的產(chǎn)物,并不能突破人類認(rèn)知的邊界去創(chuàng)造內(nèi)容。雖然說智能機(jī)器人能作“畫”,但它還離不開人發(fā)布的指令,所以,完全離開人,AI還是不能完全獨立制作出圖像來的。
隨著AI技術(shù)的快速提升,AI圖像生成會改變我們創(chuàng)建和消費視覺內(nèi)容的方式,它很快也會成為我們的助手,而將人工智能融入創(chuàng)作過程需要藝術(shù)家角色的積極轉(zhuǎn)變,藝術(shù)家必須學(xué)會與AI算法協(xié)同工作,充分利用人類創(chuàng)造力和AI生成的結(jié)果的優(yōu)勢。
(作者系江蘇省攝協(xié)新文藝群體工作委員會秘書長)
本文圖片均由本文作者蔣澍制作并提供
滬公網(wǎng)安備 31010102006431號 |