《科学》杂志:变革不是“艺术的终结”,生成式 AI 将重塑当代媒体美学
撰文:Ziv Epstein(麻省理工学院), Aaron Hertzmann(Adobe Research), The Investigators Of Human Creativity(Adobe)
来源:Science
图片来源:由无界 AI工具生成
了解创意工作的转变将有助于指导 AI 对媒体生态系统的影响。
生成式人工智能(AI)是一个备受争议的话题。迄今为止,一个突出的应用是为视觉艺术、概念艺术、音乐和文学,以及视频和动画制作高质量的艺术媒体。例如,扩散模型可以合成高质量的图像(1),大型语言模型(LLMs)可以在广泛的背景下产生听起来合理、令人印象深刻的散文和诗句(2)。这些工具的生成能力可能会从根本上改变创作者形成想法并将其投入生产的创造性过程。随着创造力被重新想象,社会的许多领域也可能被重新构想。了解生成式 AI 的影响,并围绕它做出政策决定,需要对文化、经济、法律、算法以及技术和创造力的互动进行新的跨学科科学调查。
变革的时刻并没有表明“艺术的终结”,而是产生了更为复杂的影响,重新塑造了创作者的角色和实践,并改变了当代媒体的美学(3)。例如,一些 19 世纪的艺术家将摄影的出现视为对绘画的威胁。然而,摄影并没有取代绘画,而是最终将其从现实主义中解放出来,产生了印象派和现代艺术运动。相比之下,肖像摄影确实在很大程度上取代了肖像画。同样,音乐制作的数字化(例如,数字采样和声音合成)被谴责为“音乐的终结”。但实际上,它改变了人们制作和聆听音乐的方式,并帮助产生了新的流派,包括嘻哈和贝斯鼓。就像历史上这些类似的情况一样,生成性 AI 并不是艺术消亡的预兆,而是一种新的媒体,有它自己独特的能力。作为人类创作者使用的一套工具,生成性 AI 的定位是颠覆创意产业的许多领域,并在短期内威胁到现有的工作和劳动模式,同时最终实现新的创意劳动模式并重新配置媒体生态系统。
然而,与过去的颠覆不同,生成式 AI 依赖于人们所做的训练数据。这些模型通过从现有艺术媒体中提取统计模式来“学习”生成艺术。而这种依赖也带来了新的问题 – 例如数据的来源,如何影响输出,以及如何确定作者身份。通过利用现有的工作来实现创作过程的自动化,生成性 AI 挑战了作者身份、所有权、创作灵感、采样和重新混合的传统定义,从而使现有的媒体制作概念变得复杂。因此,考虑生成性 AI 对美学和文化的影响、所有权和信用的法律问题、创意作品的未来,以及对当代媒体生态系统的影响是很重要的。在这些主题中,有一些关键的研究问题可以为政策和这项技术的有益使用提供参考(4)。
关于“人工智能”
为了正确研究这些主题,首先需要了解用于描述人工智能的语言如何影响对该技术的看法。“人工智能”这个词可能会误导人们,暗示这些系统表现出类似人类的意图、能动性,甚至是自我意识。生成式 AI 模型基于自然语言的界面,包括使用“我”的聊天界面,可能会给用户一种类似与人类互动的感觉。这些感知会破坏创造者的信誉,而创造者的劳动是系统产出的基础(5),并且当这些系统造成伤害时,会转移开发者和决策者的责任(6)。未来的工作需要了解对生成过程的看法如何影响对产出和作者的态度。这将有助于设计披露生成过程的系统,避免误导性的解释。
生成式 AI 与美学
生成式 AI 的特殊能力反过来产生了新的美学,可能对艺术和文化产生长期影响。随着这些工具的普及,以及它们的使用变得普遍(就像一个世纪前的摄影一样),它们产出的美学将如何影响艺术产出仍然是一个开放的问题。生成式 AI 的低门槛可以通过扩大参与艺术实践的创作者群体来增加艺术产出的整体多样性。同时,嵌入在训练数据中的审美和文化规范及偏见可能会被捕捉、反映,甚至放大,从而减少多样性(7)。AI 产出的内容也可能为未来的模型提供素材,创造一个自我参照的审美飞轮,使 AI 驱动的文化规范得以延续。未来的研究应该探索量化和增加输出多样性的方法,并研究生成式 AI 工具如何影响美学和审美多样性。
社交媒体平台的不透明、参与度最大化的推荐算法可以通过反馈回路(8)进一步强化审美规范,产生轰动性的,可分享的内容。由于算法和内容创作者试图最大化参与度,这可能会进一步使内容同质化。然而,一些初步的实验(9)表明,在策划 AI 生成的内容时纳入参与度指标,在某些情况下,可以使内容多样化。至于哪些风格会被推荐算法放大,以及这种优先次序如何影响创作者制作和分享的内容类型,仍然是一个开放的问题。未来的工作必须探索生成模型、推荐算法和社交媒体平台之间的相互作用所形成的复杂、动态系统,以及它们对美学和概念多样性的影响。
生成式 AI 与版权
生成式 AI 依靠训练数据来实现创作的自动化,这在法律和伦理上也提出了挑战,需要促使对这些系统的性质进行技术研究。版权法必须平衡创作者、生成式 AI 工具的使用者和整个社会的利益。如果受保护的作品没有被直接复制,法律可以将训练数据的使用视为非侵权行为;如果训练涉及基础数据的实质性转变,则视为公平使用;只有在创作者给予明确许可的情况下才允许使用;或者在创作者得到补偿的情况下,允许将数据用于训练的法定强制许可。大部分版权法都依赖于司法解释,所以目前还不清楚收集第三方数据进行训练或模仿艺术家的风格是否会违反版权。法律和技术问题是纠缠在一起的:模型是直接复制训练数据中的元素,还是产生全新的作品?即使模型不直接复制现有作品,也不清楚艺术家的个人风格是否应该得到保护,以及如何保护。什么样的机制可以保护和补偿那些作品被用于训练的艺术家,甚至允许他们选择退出,同时仍然允许用生成式 AI 模型做出新的文化贡献?回答这些问题并确定版权法应如何对待训练数据,需要大量的技术研究来开发和了解 AI 系统,需要社会科学研究来了解对相似性的看法,还需要法律研究来将现有的先例应用于新技术。当然,这些观点只代表美国的法律观点。
一个明显的法律问题是,谁可以对模型的产出提出所有权要求。要回答这个问题,需要了解系统的用户与其他利益相关者的创造性贡献,如系统的开发者和训练数据的创造者。AI 开发者可以通过使用条款要求对产出的所有权。相比之下,如果系统用户以有意义的创造性方式参与其中(例如,该过程不是完全自动化的,或者没有模仿特定的作品),那么他们可能被认为是默认的版权持有人。但是,用户的创造性影响到达到何种程度才能主张所有权?这些问题涉及研究使用基于 AI 的工具的创作过程,如果用户获得更多的直接控制权,可能会变得更加复杂。
生成式 AI 与创造性职业
无论法律结果如何,生成式 AI 工具都有可能改变创造性工作和就业。流行的经济理论 [即以技能为导向的技术变革(SBTC)] 假定,认知型和创意型工人面临自动化带来的劳动中断较少,因为创造力不容易被编码成具体的规则(即波兰尼的悖论)(10)。然而,新的工具已经引发了对创造性职业的就业担忧,如作曲家、平面设计师和作家。这种冲突的产生是因为 SBTC 未能区分认知活动,如分析性工作和创造性构思。我们需要一个新的框架来描述创意过程的具体步骤,其中哪些步骤可能受到生成式 AI 工具的影响,以及对不同认知职业的工作场所要求和活动的影响(11)。
虽然这些工具可能会威胁到一些职业,但它们可以提高其他职业的生产力,或许还可以创造新的职业。例如,从历史上看,音乐自动化技术使更多的音乐家能够进行创作,即使收入有所倾斜(12)。生成式 AI 系统可以每分钟创造数百个输出,这可能会通过快速构思加速创造过程。然而,这种加速也可能破坏创造力的各个方面,因为它消除了从头开始塑造最初原型的设计期。在任何一种情况下,生产时间和成本都可能下降。创造性产品的生产可能会变得更有效率,在更少的人工下获得相同的产出。反过来,对创造性工作的需求可能会增加。此外,许多使用传统工具的雇佣职业,如插图或库存摄影,可能会被取代。一些历史例子证明了这一点。最值得注意的是,工业革命使传统的手工艺(如陶瓷、纺织品和炼钢)能够通过非工匠的劳动进行大规模生产;手工制作的商品成为了特殊物品。同样地,摄影取代了肖像画。音乐的数字化消除了学习物理操作乐器的限制,使更多的贡献者能够进行更复杂的编排。这些工具可能会改变谁能成为艺术家的状况,在这种情况下,即使平均工资下降,艺术家的就业也可能上升。
生成式 AI 与媒体生态
由于这些工具影响了创造性劳动,它们也给更广泛的媒体生态系统带来了潜在的下游危害。随着规模化生产媒体的成本和时间的减少,媒体生态系统可能会因合成媒体的创建而变得容易受到 AI 生成的错误信息的影响,尤其是为声明提供证据的媒体(13)。这些生成逼真的合成媒体的新可能性可能会通过所谓的“说谎者的红利”(虚假内容通过破坏对真相的信任而使说谎者受益)破坏对真实捕获媒体的信任(14) 并增加欺诈和非自愿性图像的威胁。这就提出了重要的研究问题:平台干预措施,如跟踪源头出处和检测下游的合成媒体在治理和建立信任方面的作用是什么(15)?而合成媒体的扩散如何影响对真实媒体的信任,如未经编辑的新闻照片?随着内容生产的增加,集体注意力可能会减少(16)。AI 生成内容的爆炸反过来可能会阻碍社会在气候和民主等重要领域进行集体讨论和采取行动的能力。
每种艺术媒体都反映和评论其时代的问题,围绕当代 AI 生成的艺术的辩论反映了目前围绕自动化、企业控制和注意力经济的问题。最终,我们通过艺术来表达我们的人性,所以理解和塑造 AI 对创造性表达的影响是关于其对社会影响的更广泛问题的中心。对生成式 AI 的新研究应该为政策和技术的有益使用提供信息,同时与关键的利益相关者接触,特别是艺术家和创造性劳动者本身,他们中的许多人是积极参与解决社会变革难题的先锋。
译者注:文中设计 16 处注释,相关阅读可参看原文