从诗歌创作到作曲作画 AI能“理解”人类的情感了?

时间:2022-10-31 11:15:14       来源:羊城晚报

从Disco Diffusion到DALL·E,阿文的心灵地震了两次。

2015年,25岁的数据分析师阿文进入了视觉设计行业。在此之后,他使用过可以进行风格迁移的辅助工具,让待处理的图片变换各种风格。而通过输入几个指令就能够绘出一幅画——这种事情他以前想也不敢想。

直到AI作画工具陆续诞生,一次又一次的尝鲜不断颠覆这名设计师的认知。

 

AI作画撼动画手和设计师职业?

今年4月,深夜十二点,阿文躺在床上刷着微博。当他看见一个艺术家朋友晒出一幅自称AI直接生成的画——一张赛博朋克风的概念场景图,他瞬间弹跳了起来。一半是震惊,另一半是怀疑,他立马上网找了朋友所说的工具——Disco Diffusion。

当晚研究了教程后,阿文用Disco Diffusion画了一幅向日葵,而这一切只需要在Disco Diffusion输入一句话:星空下的向日葵花海。

有一种兴奋颤栗的感觉。他立马把这幅画发给几位创作者朋友。一石激起千层浪,阿文的圈子炸了,大家议论纷纷,跃跃欲试。

4月30日,阿文让Disco Diffusion模仿19世纪画家亨利·方丹-拉图尔的画作,生成效果却不及原作的十分之一。他在自己的社交账号上写道:我并没有妄想AI能企及甚至超越这些艺术家。恰恰相反,所有的测试结果都在证明着这些艺术家的伟大。

“但3个月后我被打脸了。”阿文笑道。从第一个火出圈的AI作画工具诞生开始,出于好奇心与职业需求,阿文一直追踪相关领域的动态,甚至加入了不少AI工具的内测群里,一路见证着AI作画的成长。直到Stable Diffusion出场,AI作画已能够高度模仿艺术家的风格。

AI作画潮流如一夜春风,唤醒文化产业中许多沉睡的人,迅速引发关注。社交网络众声喧哗,有诸多担忧AI侵犯版权、践踏创造力、取代画手的声音,也有对AI抱有期待的乐观主义者。

AI作画真的在撼动画手和设计师的职业吗?沉浸设计行业数年,本该产生职业危机感的阿文,却是乐观的那一派:“乍一看它的效率非常高,但其实真正用到实际工作中的时候,又没有那么出彩,这是我最大的使用感受。”他觉得,AI作画工具现在处于一个尴尬的位置,让它完全替代画家还为时过早,然而只把它当做一个可以批量生产简单图形的效率工具,又有点浪费。

至于AI作画能不能进入文化产业的一亩三分地,“至少我的同行、公司的决策者,都处于观望中。”阿文说。

Soulframe是一名独立游戏制作人。他认为,现阶段的AI作画对美术需求方的意义可能更大。也就是说,AI能帮助甲方成为更好的决策者。在他看来,根据需求方的prompts(提示词)生成的图像,总是比一堆描述性的文字来得更加直观,甚至还可以唤醒“保守”决策者的想象力。

据量子位智库关于AI-generated content(AI生产内容,以下简称AIGC)的产业报告,总体而言,AIGC目前对内容消费领域的整体影响相对有限。但随着技术的商业应用逐渐深入,AI作画将对内容行业的人才结构产生影响。由于前期渲染、整体调色等基本技能将交由AI完成,设计师的工作重点将会向提出prompts转移——即如何将艺术设想清晰地描述给AI,并提升自身的创意、审美、讲故事及搜索能力。

“我觉得未来是很有可能出现prompts师的。”阿文参加过很多AI作画工具的内测。在群组中,他总能看到有一些特别擅长写prompts的人,能够调试出最为精彩的画作。

一幅AI画作拍出43万美元的高价

随着AIGC日渐成熟,AI将成为内容工厂的赛博流水工人吗?文化创意从业者的双手与思想将得到解放吗?

当DALL·E出场时,阿文试图用它探索解决“难缠甲方”的经典问题:能不能让大象转身。DALL·E很轻松地画出两张分别展示同一只大象的背部与正面的图片。因此,不少人戏称它是“甲方终结者”。

画师、设计师苦于甲方变幻不定的要求是创意行业心照不宣的难题。沉浸体验市面已有的AI作画工具之后,阿文觉得所谓“甲方终结者”目前还只是“吐槽”式的段子。“放在实际工作中,需要调整的细节还是得自己动手才更高效”。

在阿文看来,只有当AI能够摆脱对他人的模仿,能够更好地处理细节问题时,才是一位真正完美的设计助手,才能真正解放自己的双手。“当然,那个时候或许它也能够取代我。”只是比起自己动手设计、创作获得的快乐,使用AI创作作品的成就感要少得多。

“有的时候我感觉它像是活生生的人,像一个任劳任怨的乙方。”阿文说。8月,他发布的模仿川濑巴水风格的AI画作引发网友热烈关注,他把Stable Diffusion署名为设计师,把自己署名为设计助理。

有的网友形容让AI作画就像在“施魔法”,念的“咒语”越多,AI才能够更加理解使用者的意图。“接下来的发展趋势就是提升AI作画的可控生成,也就是说,怎样做才能使作品更加贴合使用者的指令。”清华大学计算机系博士生、AI生成视频工具CogVideo作者丁铭说。

面对具有高度模仿能力的AI,艺术家如何自处?

艺术家邱志杰曾将GAN(AI生成图像三大模型之一)定义为2019年艺术界最火的新锐艺术家。法国艺术组织Obvious运用GAN创造了11幅艺术作品,其中一幅作品曾出现在2018年10月佳士得拍卖会上,并以43万美元的高价被拍走,一时引发轰动。今年9月,用AI绘图工具Midjourney生成的《太空歌剧院》在美国科罗拉多州举办的博览会艺术比赛上获得数字类别头奖,争议不断。邱志杰认为,AI的发展,可能会倒逼艺术家的“进化”。

AI的情感、意识及未来

眼见自己的作品被纳入AI的训练数据集,并由AI创作出与个人风格如出一辙的作品,有的艺术家则表达了忧虑和愤怒。

据CNN报道,德国的一对艺术家联合两位合作者推出了“Have I Been Trained”,一个可以帮助艺术家查找 LAION 数据集的搜索引擎,查看自己的作品是否被用于训练。

中山大学传播与设计学院教授冯原曾表示,人工智能会面临一个“心灵难题”:人类的心灵具有情感特征,而艺术创作离不开这种情感特征和内分泌的神经化学机制。在未来,如果AI能够超越模仿,进化出原创的能力,甚至能带着“意识”与“情感”创造,这时该如何重估AI艺术的价值?

人们总是希望AI能够“成为人”。在科幻影片《银翼杀手》中,人造人Roy在死亡将至时,饱含诗意与感情,吟诵道:我所见过的事物,你们人类绝对无法置信。我目睹战舰在猎户星座旁起火燃烧,我看着C射线在唐怀瑟之门附近的黑暗中闪耀。所有这些时刻,终将流失在时光中,一如眼泪消失在雨中。

“其实AI现在多多少少能够理解一点人类的情感。”丁铭说。通过映射,当操作者输入“一个快乐的人”,AI能够将“快乐”与“笑容”对应起来,从而画出一个面带笑容的人。只是在实际应用中,AI对情感的理解和模拟还停留在浅层。

“至于AI能不能有意识,研究界也有不少探索,但大多还只是假说。”丁铭说。上世纪末,美国心理学家伯纳德·巴尔斯等人提出意识模型“全局工作空间理论(GWT)”,是当代主要的神经科学意识理论之一。有人提出,当下的深度学习已经可以基于GWT,将处理不同模态转换的神经网络即功能模块,结合为一个系统,从而迈向实现通用人工智能的下一个阶段。AI艺术的未来能达到怎样的高度,似乎也取决于意识模型的应用进程。

AI画作的价值,又关系到对艺术价值、功能等方面的界定。邱志杰表示,艺术的价值不单是美学的,也是社会的,更是一个政治经济学的问题。至于AI能不能开创艺术史乃至人类的新篇章,则需要交由时间和科技验证。

关键词: