聚焦人工智能文藝的“算法”
日期:2024-08-07 來源:中國社會科學網-中國社會科學報
2024年初,文生視頻模型Sora橫空出世,在ChatGPT基礎上取得了重大突破,推動人工智能文藝實現又一次跨越性發展。雖然人工智能文藝的算法運算所基于的深度學習神經網絡或大模型不同,但無論是卷積神經網絡、循環神經網絡、擴散模型、轉換器模型還是不同模型間的組合、進化,都宣示了“算法”在人工智能文藝中的核心地位。算法不僅延伸了人類的智能,更拓展了人類的美學經驗。在算法全面介入文學、藝術,驅動單模態甚至多模態文本生成、圖像生成、動態影像生成的今天,人工智能文藝研究必然無法拒斥、回避算法。
算法的位移
人工智能和文藝的結合從未像今天進入大模型階段后這樣緊密和普遍,傳統上利用算法進行文藝生產的能力僅僅被少數先鋒藝術家掌握。譬如,20世紀60年代就出現了雷蒙·奎諾(Raymond Queneau)、喬治·佩雷克(Georges Perec)等藝術家和數學家組成的實驗性團體“潛在文學工場”,也被稱作“烏利波”(Oulipo)。該團體的理念是通過數學邏輯和約束性創作原則挑戰文學創作的界限,探索文學藝術創造力的邊界,從而挖掘文學與數學、科學之間的關系。
雖然藝術家和藝術家團體開辟了算法文藝的先河,然而這種需要掌握復雜數學運算邏輯和運算技術的大膽文藝創作,對于普通人而言極具門檻,普通人甚至大多數藝術家都難以進入依靠運算進行藝術創新的先鋒領域。直到大模型算法出現的今天,這樣的算法文學、藝術創作權才在技術和資本的合作推動下賦予普通人。尼葛洛龐蒂所謂的“人人都有麥克風”在今天發生了新的形變,幾乎人人都能夠借助人工智能平臺工具進行專業化的文藝創作。這是算法在文學藝術中的首要位移,不亞于攝影術誕生所帶來的機械復制時代的藝術后果。
整體而言,作者、作品、讀者和世界四要素紛紛被大模型算法滲透。作者不僅包括人類作者也包括人工智能這樣的智能類主體,作品由數據和算法在人類關鍵詞的引導下自動生成,讀者的趣味受到算法策展的影響,世界也在算法轉譯下進一步編碼為虛擬真實世界。四要素被算法滲透,也兩兩之間形成相互作用的循環。人與算法在關系、互動、相互滲透中塑造了今天人工智能文藝的基本圖景。
進一步思考,大模型算法對四要素以及人工智能文藝圖景的整體變革是在兩個基點的基礎上形成的。大模型算法一方面帶來“人機交互”的進化,另一方面實現了對“虛擬真實”的進一步拓展。ChatGPT和Sora分別揭示了這兩種底層邏輯。作為Open AI發布的應用,ChatGPT能夠在與人類創作者的多輪對話中進行記憶、聯想和推理,人機交互的流暢度和有效性提高了文藝生產效能;而Sora的“模擬世界”能力體現在能夠根據用戶輸入文本生成高清、連貫的一鏡到底視頻上,顯示了其對現實世界的模擬甚至復制能力,塑造了大模型時代虛擬真實的地理學。
這兩個基點使大模型文藝相較于前大模型時代的人工智能文藝實現了跨越式發展,這不僅是大模型時代之前的算法無法做到的,也是決定人工智能文藝未來發展方向的重要立足點。因此,在“人機交互”和“虛擬真實”兩個基點層面算法實現了第二重位移。
算法對人本主義的僭越
古希臘哲學家普羅泰戈拉提出,“人是萬物的尺度,是存在者存在的尺度,也是不存在者不存在的尺度”,人能夠憑借邏各斯衡量萬物。然而,一定程度上,人工智能文藝中的算法卻僭越了人類作為萬物尺度的法則。算法對人類的僭越不僅體現為算法能夠通過計算生產出無法和人類作品相區分的作品以替代人類,還體現為算法能夠僭越人類制定的藝術創作規則,以其能動性、自主性和偶然性實現對“潛在空間”的采集和開發,超越了人類文藝生產的邊界。
隨著生成對抗網絡(GANs)的出現,AI在視覺藝術創作過程中的使用顯著加速。GANs通過一個生成器和一個判別器來進行底層“不可見”的計算工作。生成器通過學習數據集的特征盡可能地生成和原數據集數據分布相同的數據,接下來判別器執行“判斷”功能,對生成器生成的數據進行判斷。如果被證偽,那么生成則是失敗的。如果不能被證偽,判別器就會對數據“放行”,輸出一個和原數據集相同的數據。GANs很快成為人工智能中最重要的研究領域之一,并且出現了基于許多原始架構的特定變體,例如CycleGAN、StyleGAN和BigGAN。我們很多時候無法分辨、區分GANs和人類創作的作品。“跨物種”的風格傳承使GANs在“模仿”的合格性和有效性上具備了“替代”原作者的可能,人作為萬物尺度的崇高性被算法消弭,形成了算法對人類的第一層僭越。
此外,算法文學的創作過程基于算法規則,而算法規則是通過智能算法學習人類文學創作的規則而來,它本身不創造規則。但是算法卻能夠僭越人類制定的規則,在偶然性的維度上拓寬人類的藝術創作邊界。GANs的創作由于過于“相似”使藝術品不具備喚起潛能(arousal potential),因此算法的進化方向即在“相像”的基礎上發生風格的“偏移”。創意對抗網絡(Can)和GANs相比,調整之處在于除了對“是否為藝術品”進行判別,還需要對“藝術風格分類”進行判斷,判別器的兩個判斷過程可以指導生成器生成與藝術品近似的數據(art/not art)。以此為基礎,算法通過“畫風融合”(style ambiguity)生成難以判別風格類型的畫風,從而實現風格的偏移、創新,達到喚起潛能的作用。以算法的創作沖動和創作偶然性脫離人類規則的束縛,以算法的自主性拓寬藝術以人為中心劃定的邊界,這是算法對人類的第二層僭越。
算法的價值偏差
基于算法在人工智能文藝中的位移和算法對人本主義的僭越,我們不僅可以確認算法在今天人工智能文藝中的重要性,并且可以發現算法及其文藝創作具有人類“無法掌控”的一面。這種不可控性不僅發生在實踐上,還存在于文藝價值層面內含的算法偏差。
在長期以來反對“技術決定論”聲音的影響下,“技術中立性”也似乎成為我們進行技術研究的基礎邏輯前提。遵循此邏輯,算法是純粹由數學邏輯驅動的計算程序,因此具有中立性、客觀性,計算程序本身無價值偏差或文化偏向。但實際上,由于算法一般歸平臺所有,受平臺資本及其意識形態影響,或由人類算法工程師、藝術家設計,訓練算法的數據集則由人類某一領域或多個領域的數據痕跡、數字記憶構成,三個方面層層隱含著人類的價值偏向。
此外,從技術角度而言,算法計算過程的不透明性和偶然性也有可能導致算法偏差問題的發生。技術上的偏差與人類偏差相互作用,形成算法偏差。這樣的算法偏差也存在于人工智能文藝中,由于藝術審美性、游戲性、無功利性的特質進一步掩蓋了其內在的算法偏差,因此往往更加不易察覺,使欣賞者在算法輸出和算法推動作用下全盤接受和內化其偏差。
人工智能文藝的算法研究應當揭開人機互動的復雜性過程,在設計、過程、行動、結果多層次上糾正算法偏差,強調人工智能文藝主體責任、保障數據挖掘的準確性、提高算法透明性和可解釋性,通過設計和應用道德代碼來規避算法偏差,確保科技向善。
綜上,現實層面算法在人工智能文藝中的位移、算法對人本主義的僭越、算法的價值偏差導致了文藝研究聚焦算法的必然。目前,算法仍主要是計算機科學的研究內容,“算法黑箱”的存在和技術門檻上的障礙,使得文藝研究一定程度上仍然和算法保持距離。近年來,雖然有學者提出“算法闡釋”(參見曾軍《算法闡釋:人工智能時代的文論問題》)、“算法批評”(參見秦蘭珺《通向算法合成時代的文藝評論》)這種開拓性的觀點和方法,然而文藝研究對算法的研究空間需要進一步拓寬。就可行性而言,雖然算法的技術結構和運作過程無法為創作者全面掌握,但這并不妨礙我們對其文藝生產的過程和后果進行研究。秦蘭珺認為,算法合成時代的文藝需要給“人”的因素和“非人”的因素以同等重要的考量,這不僅是為了賦予“物性”以能動性,更是為了呈現和批判“物性”中內嵌或隱藏的“人性”。聚焦算法,界定算法在人工智能文藝中的位移、審思算法不可控性對人本主義的僭越、規避算法價值偏差帶來的負面后果,探索人類與算法如何在關系性中拓展一種人類—非人類的美學體驗,這是與人工智能文藝算法相遇時無法回避的追問。
(作者系杭州師范大學文化創意與傳媒學院講師)