当AI开始画画:画师会失业吗?
把脑海中的画面用一句话表达出来,尽可能细节化,然后点击鼠标,只需要几秒钟,你就能获得一张高度渲染的精美图片。当然,你也可以只模糊地输入几个字,描述越模糊,得到的结果越出乎意料。哪怕你连画笔都没拿过,也能“画”出一幅梵高的《星空》和莫奈的《日出》。如果想象力更丰富些,你还能“画”出赛博朋克风格的洋葱,或者克苏鲁风格的中国山水。
数字艺术的门槛从未如此之低,直到人类发明了AI(人工智能)绘画。今年,几个AI绘画系统成为艺术界最热门的话题,并且迅速向大量普通用户普及。AI在攻破围棋之后,似乎正在气势汹汹地掀翻艺术。
就像AlphaGo通过反复学习海量围棋棋谱,掌握了这个智力游戏的奥义。AI也吸收了海量艺术家创造的作品,从而可以轻易吐出人们想要的任何风格。这让画家感到紧张——毕生所学,却不如轻松地输入几个字?更紧张的是那些依靠数字作图为生的图像从业者,如游戏、电影、工业设计等行业,当他们看到迅速迭代进化的AI绘画,直呼“原地失业”。
AI绘画狂飙突进的同时带来了一系列伦理问题。当艺术家的作品被AI从互联网上随意抓取和学习,他们每一次新的创作,都在训练一个无形而强大的对手。很多艺术家提出抗议,宣布禁止AI学习自己的作品,但AI开发者们正加班加点升级系统,无暇作出回应。
基于Midjourney生成的图像,已经具备较强的细节还原能力。图/Bartosz Titkin
人类又输了?
今年4月,基于谷歌技术框架的AI绘画程序Disco Diffusion突然走红。Disco Diffusion的界面相当不友好,毫无编程经验的人简直无从下手。好在已经有网友写下了详细教程,按图索骥,在正确位置改好参数,输入英文指令,点击运行,几十分钟后,就能查收做好的图了。对于新手来说,操作并不简单。随后,Open AI组织发布了一段AI绘画系统DALL-E2的宣传视频,这个视频让很多人惊讶,AI绘画已经能达到如此水准,并且操作比Disco Diffusion简便很多。AI绘画出圈了。
科技博主“Simon_阿文”就是那时关注到AI绘画的。“不可思议,”他惊叹,“这个东西我是不可能想象到它的存在的。”相比Disco Diffusion,DALL-E2的精准性和清晰度明显提升。随后三四个月,各大互联网科技公司纷纷下场,谷歌发布了Imagen和Parti, Facebook发布了Make-A-Scene,微软发布了NUWA,一家初创公司发布了Midjourney……在中国,百度也上线了中文版的AI绘画工具“文心·一格”。
市面上这些系统,各有各的“性格”。有玩家总结,Disco Diffusion的输出结果往往出乎用户想象——有时是惊喜、有时是迷惑,它似乎有着自己的艺术野心;而Midjourney则更接近于人们的想象力,能将人们脑海中的画面高水准复原出来,更适合作为一种辅助工具。
AI绘画以前所未有的速度自发推广开来,Midjourney已经拥有150万用户,预计1个月内还将再翻5倍。用户们乐此不疲地精进技术,享受着从菜鸟到画家的飞跃。在豆瓣有关AI作图的话题下,“天净沙·秋思”“麒麟”“中秋”“琼楼玉宇”等中国元素的AI画作占据了半壁江山。一幅剑士图成为“镇楼神作”,画中一位剑士直面恢弘的滔天巨浪,颇具近年流行的国漫风格。
更令人吃惊的是,AI绘画正以极快的速度迭代和进步,上个月还对人脸的勾画技艺生疏,这个月已经足以乱真。一些更新的应用形式也迅速被开发出来,比如Story Dall-E 可以让一组AI绘画里的人物形象保持一致,可以被用于漫画和动画。Open AI组织的Clip则可以直接用AI制作动画,由Clip生成的短片《The Crow(乌鸦)》,获得了今年戛纳短片电影节的评委奖。
进入8月,各大巨头的AI绘画技术之战因Stable Diffusion的发布告一段落,原因不仅在于Stable Diffusion出色的能力和59亿张图像的数据库,更在于其关键一举:开源。全球技术开发者得以在其模型基础上二次开发,衍生出各种各样的新工具,AI绘画发生了核爆效应。比如,开源第一周,基于Stable Diffusion模型的Photoshop插件就出现了,轻而易举将Photoshop带入AI绘画时代。
同样在8月,AI绘画的争议从网络蔓延到现实生活中。在美国科罗拉多州博览会新兴数字艺术家竞赛中,一位名叫杰森·艾伦的参赛者提交了一幅用AI绘画程序作出的《太空歌剧院》,获得了最高奖。一时间群情激奋,很多参赛者和网民指责他作弊。但他一开始就是以“杰森·艾伦利用Midjourney”的署名提交作品,并没有违反任何规则。而且,竞赛组委会也没有表示收回奖项。
“艺术已经死了。”获奖后的采访中,面对汹涌的争议,这位39岁的游戏工作室老板硬气地回应,“AI赢了,人类输了。”
基于AI软件生成的油画风格图像。图/Clangorwind
画师会失业吗?
比之AI下棋与写诗,AI绘画给人们带来更深一层的冲击感。它不仅宣告机器向着人类艺术创造的顶峰再下一城,似乎更加拿捏住了人类引以为傲的审美,并且,对一些职业造成了现实的威胁。比如游戏制图、影视美术、工业设计等领域,AI看上去稍加训练便可以替代,想象力甚至超越人类。在互联网上,关于AI绘画讨论度最高的一类问题就是:“ AI 绘画是否会让画师失业?”“游戏美术正在被AI‘杀死’吗?”……
“让美术师画100种不重复的乱石堆,可能会被打,但AI可以随便出1万个给你慢慢挑。”策略游戏开发者“正义的史官”已经用上了AI,她的团队正在使用Stable Diffusion画效果图、ICON(图标)以及乱石堆之类的素材。最成功的应用是大批量输出ICON,原本需要美术师来做的大量工作,简化到只要一个人来选图。她还用AI设计游戏里的勋章,只要输入关键字,挂一个晚上,早上就收到了几千个,大部分都可以直接投用,而人工一天最多只能画十几个。
游戏行业里一个让人头疼的问题,是制作人与美术工作人员之间的沟通障碍。灵游坊创始人、《影之刃》系列游戏制作人梁其伟说,制作人往往无法明确表达需求,美术工作人员只能自行捉摸,导致大量反复乃至返工,最大的成本和时间损耗往往来源于此。AI将带来巨大改变。在设计初始阶段,AI可以根据气氛、光照、风格、质感等设定生成大量草图,在此基础上,制作人与美术人员能够迅速领会彼此的需求。
在国内,游戏行业最先对AI绘画跃跃欲试,这个对美术资源的数量和效率都有着极高要求的行当,已经预感到变革将至。但具体如何驯服这头有着无限可能的猛兽,还没有一个行之有效的方法论。
梁其伟最近就在考虑这个问题,他觉得很可能AI对美术需求发起方的意义,超过对美术执行方的意义。换句话说,如何用AI作画还是其次,更重要的是,AI将告诉我们“画什么”。在立项之前,制作人可以把一拍脑袋想出来的主意交给AI,加些关键词,反复测试,看看能生成什么,是否符合“感觉”——“这个词说出来时,往往是他手下美术创作者们的噩梦,但AI显然可以不知疲倦地满足任何无理的要求。”
想通了这个流程以后,梁其伟做了一个测试。他编写了一个完整的背景故事,用AI生成了一系列图片,然后由两位美术师继续处理,有些图结合了多张AI生成的结果,也有一些对结构进行了手工补绘,最终拼贴成具有叙事意义的组图。这组结合了中国武侠和北欧克苏鲁风格的图片一经发布,收获了数千转发。
“打不过就加入嘛。”Simon_阿文说。他是一位PPT设计师,4月份他还乐观地说:“AI不会让我失业,而我大概率能早点下班。”那时他刚刚尝试AI绘画,发现技术还挺粗糙,最多在背景和纹理的创作上能帮帮忙,更细节之处就无能为力了。然而短短几个月,AI绘画突飞猛进。Simon_阿文觉得现在AI已经达到中下游画师的水准,一批画师肯定会被替代。而这仅仅是今年9月的水平,“一年之后能达到什么程度,不敢想象”。“正义的史官”已经决定,下个项目尽可能用AI绘画获得美术资源,这样开发成本会下降至少一半。
事实上,一些画师不仅不会被淘汰,还会因为拥有一个前所未有的工具而所向披靡。当熟知美术知识的画师们下场指挥起AI,可想而知,AI将会创造出比现在这些画作惊艳得多的作品。在普通人手里,AI常常会不受控制,但到了画师手里,它们就像被驯化的超级战马。“只要你愿意,就能成为一个非常优秀的由AI辅助的艺术家,”Simon_阿文说,“完全没有必要抗拒。”
创造艺术还是窃取艺术?
当人们输入指令:“小女孩,大头,奈良美智。”AI三秒钟吐出一幅酷似奈良美智经典风格的绘画时,这幅画的作者到底是谁?是奈良美智、用户,还是给AI写代码的程序员?当艺术家的毕生作品被AI精准地学习和模仿,艺术家要如何维护自己的权利呢?
波兰概念艺术家格雷格·鲁特科夫斯基为此感到忧虑。他以油画风格的恢弘奇幻作品闻名,最近成了Stable Diffusion中最受欢迎的模仿对象之一。他在网上搜自己的名字,蹦出的都是AI的画,自己的作品已经被淹没了。仅仅一个月,他的名字被AI作为关键词使用了93000余次,而米开朗琪罗、毕加索、达·芬奇只被使用了2000余次。最近一次采访中,鲁特科夫斯基感叹,他感觉职业生涯受到威胁。
对于艺术家的忧虑,AI绘画系统Midjourney创始人大卫·霍尔兹(David Holz)的解释有些牵强。他宣称,艺术家们对技术团队说,他们希望AI更好地“窃取”他们的风格,这样就可以将其用作创作流程的一部分,“这让我惊讶”。他还说,很多知名艺术家都认为这个工具很有趣,就像一名艺术学生,当它引用某位艺术家的名字创作一张图片,就像一名艺术生受艺术家的启发创作一些东西。
这种以偏概全的观点几乎不值一驳,只要稍加留意,就能看到大量来自艺术家的怒斥。日本的AI绘画软件“mimic”上线后,一批漫画家集体声讨,要求开发者禁止让AI模仿自己。国外一些艺术家正在组建联盟,希望推动新的政策法规。柏林两位艺术家搭建了一个名为“我正在被用来训练吗”(Have I Being Trained)的网站,艺术家可以检索自己的作品是否进入了AI训练数据库。还有一种声音呼吁,如果注定无法阻止,至少应该给艺术家付费。
然而对于艺术家的抗议,AI开发者要么只是敷衍几句,要么干脆捂住耳朵。
数字艺术家R·J·帕尔默在社交媒体上与AI开发人员辩论了一番,然后,他就被这位开发人员拉黑了,讥讽他为“道德家”。帕尔默公开表示,AI开发者有责任以合乎道德的方式获取训练AI的图像,而不是无休止地盗用艺术家的头脑。
专栏作家安迪·巴约将AI绘画形容为潘多拉魔盒。他总结了三个争议焦点:在未经许可的情况下,用大量受版权保护的创意作品训练AI,是否合乎道德?允许人们以摄影师、插画家和设计师的风格创作新作品而不给予补偿,是否合乎道德?基于他人的工作为这项服务收费,是否合乎道德?现在似乎只能在道德的范畴里讨论,因为让法律对此类新事物表明态度则更为遥远。
同样让人们担忧的是,AI绘画还显示出了一些危险的倾向。在自由创作和发布的情况下,用户可能会制作出暴力与性等令人不适的图像。Midjourney创始人大卫·霍尔兹在媒体采访中承认了这种危险的存在,他说,运营团队每次看到这种图片,就会清理出去,必要时会设置敏感词。而Midjourney背后的技术团队只有十个人,其生成的图片每分钟都在海量增长。
另一种危险是生成真人面孔的图片,并进行进一步创作。Stable Diffusion允许用户生成名人肖像、裸体等图像,这些内容在DALL-E2和Midjourney中是禁止的。英国女王去世后,很多用户生成各种风格的女王照片以示悼念,但同样,也有人生成了“塔利班的侃爷”等争议性图像,甚至出现了基于Stable Diffusion模型的色情图片生成网站。
正因为Stable Diffusion的开源,技术团队无法对所有内容进行审查,导致基于其模型的有害信息难以得到限制。虽然经受着广泛的谴责,但在目前群雄混战的形势下,这种开放精神带来的竞争优势,使得该团队不舍得轻易做出改变。而投资界正在进入这片蓝海,在可预见的将来,伦理和版权问题尚未解决之时,新一轮爆发式增长将带病前行。
“我们可能正处于艺术创作大规模民主化的开端,又或者,这些平台可能会使艺术家本已岌岌可危的生活更加艰难,而为深度伪造、有害信息以及在线剥削开辟了新途径。”专栏作家安迪·巴约说,“我真的很想看到更多前者,但它不会自行发生。”
2018年佳士得拍卖了法国技术团队创作的《爱德蒙·贝拉米肖像》。
基于Midjourney生成的图像。图/Alexander Tsaruk
AI绘画是艺术吗?
过去十年,人工智能技术获得了突飞猛进的进展,得益于三个重要因素——图形处理单元芯片(GPU)、深度学习和大数据。
2010 年代,英伟达等公司为视频游戏开发的GPU性能以惊人速度提升,GPU并行运行大量计算的能力,非常适合应用于神经网络——模仿人类脑细胞相互作用方式的程序,这为机器模仿人类的学习行为提供了基础能力。而互联网上各领域的大数据海量激增——照片、图画、音乐、棋谱……则为机器学习提供了取之不尽的资源,使得AI轻易掌握了人类积累的智力成果。
AI绘图最根本的基础技术与擅长围棋的AlphaGo是相通的,都是让系统深度学习人类的作品,从而产生模仿行为。与当年伴随着AI围棋或写诗的争论如出一辙,针对AI绘画最犀利的怀疑和不屑,来自于对其独创性的怀疑。换句话说,AI缺少“人味儿”,制造的只能是赝品。
依据这种观点,AI抒发不出“近乡情更怯,不敢问来人”这种微妙的人类情感,同样地,它也无法勾勒出《蒙娜丽莎》那一丝若有似无的微笑。即使生成一些触动人心的细节,由于我们已经知道这出自于算法,而非一个活生生的人的内心表达,艺术的灵韵便丧失了。
然而,凭着AI的学习能力,这个问题有一天是否也可以解决呢?
中国美术学院艺术人文学院副教授张激认为,这其实是一个伪命题。“我觉得它不仅有人味儿,而且比很多人还画得好。”她肯定地说,“因为AI的学习能力和速度远远超过普通人,将比大师之外的普通艺术从业者都画得好。”
张激近七八年一直追踪人工智能艺术。2016年,谷歌的深梦举办了第一个人工智能艺术展览:“神经网络的艺术”,2018年佳士得拍卖了法国技术团队创作的《爱德蒙·贝拉米肖像》,她觉得那些作品都有缺陷,但市场给予了认可。眼下AI绘画和动画艺术的品质已经向前走了一大步,“我很喜欢,很感动,为历史的步伐而感动。”
当数字艺术家田晓磊看到AI绘画时,他感到恐惧,艺术创作这件事已经被AI摸透了。本质上,他觉得艺术作品其实就是人操作的一套算法:筛选风格、寻找语言、探索构图、不断试验……如今这套算法已经在计算机层面解决了。“你那一套反而还没它高效,一比就很落伍,这是最大的威胁。”他对《中国新闻周刊》说,“把AI作品视为一种独特的艺术风格,我觉得一点儿问题都没有。”
Midjourney创始人大卫·霍尔兹对AI艺术保持着清醒的谦卑姿态。他认为艺术往往是关于故事和情感的,但AI艺术不具备这些,AI艺术里的故事和情感,来源于使用它的人。
“AI是关于想象力的算法,但诸如幽默感这类只有人与人能相互理解的趣味,最终是最珍贵的。”田晓磊说,“但我不知道这是否也可以被一套算法破解,因为人作为一种生物,或许也只是一套算法。”
从古至今,艺术都是人类独有的能力,但AI这种前所未有的人类超级模仿者出现后,其创作的作品能称为艺术吗?AI会改变艺术的定义吗?
伴随着AI的突飞猛进,这个哲学问题可能会持续很多年。其中一个讨论的角度在于,艺术作品是与作者的关系更大,还是跟欣赏者的关系更大。罗兰·巴特有一句名言,作者死而后读者生。“一件艺术作品的意义,是在它与读者、观众、欣赏者的交互中不断被重构的,”张激说,“艺术史有时候是想象的。所以最真实的是这件我们能看得到的作品,以及它和每个观众的感应。意义在纠缠中产生,同样,价值也在关系中产生。”而美术和关于美术的观念,从来没有停止过演化的步伐,AI不仅产生新的艺术形式,也将塑造关于美术的观念。
100多年来,古老的艺术总是不断经受新技术的威胁。给美术带来过最严重恐慌的是摄影术,但美术活下来了,只是画像师这个职业几近消亡。Photoshop等制图软件又带来了一次冲击,美术也活下来了。这一次,会有什么不同吗?
发于2022.9.26总第1062期《中国新闻周刊》杂志
杂志标题:当AI开始画画:画师会失业吗?
记者:倪伟