Rotary Club of Taipei West

[例會演講]「生成圖像的機會與挑戰」~政大新聞系 李怡志 助理教授 主講 (D3523 大加蚋扶輪社CP Richy)

只要寫一行文字,就讓電腦產生一張圖、一節音樂、一篇文字,甚至一段影片。從去(2022)年開始,這種受到人工智慧驅動的生成技術讓人類感到驚訝。雖然我們並不是第一次面對顛覆性新科技,但這次可以適應時間相對要短很多,難免令人焦慮。

 

人工智慧生成技術(generative artificial intelligence,或稱Generative AI、生成式AI)在過去一年間,突然從少數幾個服務系統變成一個巨大的體系,其實生成藝術或生成圖像的技術不算嶄新,從1960年代開始已經有60年的歷史,也累積了許多針對生成圖像特性的看法與研究。有些觀點雖然已經久遠,不過對應最流行的人工智慧生成圖像(artificial intelligence generated Art, AIGA)依然歷久彌新。

生成藝術包含了許多藝術形式,例如文字和音樂。生成藝術不一定要使用電腦操作,在目前AIGA發展的脈絡下,最重要的特性為「具有演算法」。創作者不一定要撰寫演算法,重點是演算法可以自主運行,而人類必須學會適應這個演算法展現出來的抗性,也就是創作媒材展現出需要被被控制與學習的特性。


在演算法之後,後續幾個特性都與演算法有關。第二個重要的特點為隨機性 (Randomness),在同一個演算法之下,每次生成的內容都不會一樣。生成工具在同樣的指令下,每次都生成一模一樣的東西,則無法稱之為生成。第三個特性為不可控,不像紙筆、或者電腦繪圖,每一筆下去,位置都如同創作者的規劃,但生成圖像必然有部分不受創作者控制。不論是1%還是99%,生成藝術的創作者必須讓電腦多少可以獨立完成內容,而不是全然由人類控制。

 

第四個生成的特性為迭代,因為圖像會隨機生成,創作者必須不斷修改提示或產出變異,直到自己滿意為止,在這個過程中,每一張圖都可以視為下一次生成的草圖。第五個特性接續了前面四個特性,也是非常多文獻都會提到的特點,即為偶遇性(serendipity):創作者會在預期之外得到覺得很好的作品。研究電腦創意的馬赫(Mary Lou Maher)形容,偶遇來自於對焦距的改變,讓創作者可以重新分類自己對作品的架構,從而發現產出物的新價值。

最後兩個特點為選擇及策展,這兩個特性主要都在AIGA出現後才被學者提出。在生成工具大量生成圖片後,選擇成為創作者非常重要的主控權,同時大量的作品也能被創作者以策展的方式產出新的意義。


創作教學的未來方向
過往美術教學通常依循傳統從草圖到成品的漸進模式,較少將美術歷程與文字創作結合。但隨著生成工具的逐步發展,局部生成工具的日益成熟,美術與語文的教師都可以嘗試讓學生以「草稿」取代或修飾「草圖」,並在生成工具的協助下,逐漸完善文字提示,從中體會生成特性中的隨機、偶遇與選擇。


從另一個角度來看,圖像生成工具也能成為文字創作的輔助工具。由於生成圖像對於每一個詞彙都有自己的表現方式,加上愈來愈多平台,如 Bing Create,也開始接受中文提示,老師也可以多鼓勵學生從事各種完整短篇創作,透過生成圖像工具不斷再現後,回頭修改文字,直到文字能夠呈現心像為止。


生成圖像工具擁有豐富的生成性和文字性,相信這兩種新的創作特性加上文字與圖像相互影響的雙元性,可以在科學與教育上繼續激發我們的創造力,而非限制人類的想像。
(本文摘錄自主講人2023年7月號「科學月刊」稿件並改寫)