版权悖论是一个令人深思的问题。一方面,保护 AI 创作旨在激励科技的发展和创新,让 AI 能够更好地为人类服务,为文化创作领域带来新的可能。但另一方面,过度强调 AI 创作的版权保护,可能会导致人类创作者的积极性受到打击。如果 AI 创作被过度垄断,人类创作可能会被忽视和扼杀,失去其独特的价值和魅力。如何在保护 AI 创作的同时,不抑制人类的创造力,是一个需要我们认真思考和平衡的难题,这关系到文化的传承与发展。
新兴科技公司试图在现有版权所有者的支持下打造自己的产品——未经许可或支付报酬就盗用他们的作品。面对这一前所未有的挑战,版权法无法演化出平衡的结果。涉及生成式人工智能的更深层次、更长期的冲突,并非科技公司与内容所有者之间的对立,而是内容所有者与其自身员工和供应商之间的对立。
版权法在即将到来的转型中将发挥重要作用,但必须从其他途径寻求平衡的解决方案。
在一系列诉讼以及一些立法改革之后,一种新的平衡或许将出现:既能容纳新技术,又能保护版权所有者。
数据喂养的合法争议:AI训练的“合理使用”防线能否守住?
版权所有者和代表版权所有者的组织(包括《纽约时报》和美国作家协会)已起诉科技公司,指控其在未经同意或补偿的情况下使用其作品训练人工智能模型。包括OpenAI和Anthropic在内的科技公司主张,他们的复制行为属于合理使用。他们援引这一法定抗辩理由,对侵犯版权的指控进行抗辩,理由是他们的复制对于创造一种不与复制材料竞争的新产品——生成式人工智能模型——是必要的。《纽约时报》一案的法官最近驳回了一项驳回侵权指控的动议,除非双方达成和解,否则该案至少将进入审判和判决阶段。
虽然结果尚不明朗,但人工智能公司似乎明显占了上风。科技公司确实会为了创造新产品——大型语言模型(LLM)——而对作品进行中间复制,该模型可用于生成与输入作品同类的输出。但是,除了产出与某一输入作品本质上相似的极少数情况外,这些模型的产出并不会与被复制的特定作品竞争,而是通过将它们的精确复制品投入流通。
当然,法院可能会认定,更广泛地说,人工智能模型会损害与用于训练它们的作品类型相同的受版权保护作品的市场。但法院似乎不太可能走到这一步。版权的目的是防止现有内容的大规模复制和分发,从而使作者能够从创作这些内容中获得经济回报。说版权法延伸到保护现有书籍免受同一主题的其他书籍的竞争,或为未来可能永远不会存在的未写作品保留市场,似乎有些牵强。
透明法案的悖论:未落地的剑,何以斩数据黑箱?
在训练人工智能模型时使用受版权保护的材料的合理使用辩护尚未解决,这意味着政府正在考虑的各种透明度措施还为时过早。
2024年4月,时任美国众议员亚当·希夫(D-Calif.)提出了《2024 年生成性人工智能版权披露法案》,该法案要求人工智能模型开发者向版权登记处提交一份通知,其中包含用于训练其模型的所有受版权保护作品的足够详细摘要。参议员彼得·韦尔奇 (D-Vt.) 于 2024 年 11 月提出的《人工智能网络透明度和责任法案》,要求人工智能模型开发者向内容公司披露用于训练人工智能模型的所有受版权保护的作品。这两项法案都可能在今年重新提出。
美国加州立法机构于2025年2月提出了一项法案,要求人工智能模型的开发者为训练中使用的每部作品创建一个“近似内容指纹”,让内容社区知道如何使用相同的技术创建指纹,然后使用该技术响应识别请求。
这些措施的问题在于,它们预设了合理使用抗辩已经失效。如果未经许可对受版权保护的作品进行训练也构成合理使用,那么这些强制披露就毫无意义。这样就不会构成侵权,因此也无需强制披露来允许版权所有者提起侵权诉讼。人工智能公司和版权所有者将浪费大量时间和资源来创建毫无意义的透明系统。
人工智能公司的合理使用辩护也可能失败,但在这种情况下,立法机构将希望建立一个修订的版权制度,以平衡人工智能开发者和内容所有者的需求。这可以采取强制许可的形式,就像版权局2023年发布的《调查通知》中所讨论的那样;或者采取任何必要的法律变更(例如美国作家协会建议的反垄断豁免),以使内容所有者能够组建集体权利组织,与人工智能公司协商,获得将受版权保护的内容用于人工智能训练的全面权利。
但即使合理使用抗辩失败,版权所有者想要向人工智能公司主张其权利,透明度措施可能也并非必要。法院和立法机构采用可反驳的推定,即如果某件作品出现在互联网上,则其复制行为是为了进行人工智能训练。复杂而昂贵的识别系统对于版权所有者主张其权利而言,可能并非必要。
AI模仿风格:难以保护的“灵魂指纹”
人们普遍认为,与现有受版权保护的作品实质相似的人工智能输出,将构成侵权。因此,人工智能公司会不遗余力地筛选其输出,以确保其不重复现有作品。
然而,当人工智能系统生成的输出模仿了作者和艺术家可识别的风格时,“实质性相似”标准并不能保护原作者。这可能会对他们的生计造成极大的损害,尤其是因为竞争对手可以使用人工智能模型制作大量模仿内容,因为将类似版权的保护扩展到可识别的风格,在法律认定上存在诸多困难。
尽管如此,创作者生计面临的威胁如此之大,以至于立法者应该考虑制定一项法律,赋予在世内容创作者控制并因模仿其可识别风格的人工智能输出而获得报酬的权利。
OpenAI 已经意识到这一问题,并在没有相关法律的情况下试图解决。该公司表示,其最新的图像生成工具包含“一项拒绝机制,当用户试图生成在世艺术家风格的图像时会被触发”。但这一保护政策的力度似乎并不大,因为它允许用户生成“更广泛的画室风格”的图像。这使得大量模仿日本动画公司吉卜力工作室(由日本艺术家宫崎骏领导)作品的情况出现。这就好比 OpenAI 愿意阻止生成彼得·保罗·鲁本斯风格的艺术作品,却允许生成鲁本斯在安特卫普工作室风格的艺术作品。这一漏洞可能是立法需要考虑填补的。
版权悖论:保护AI创作=扼杀人类创作?
在近期判决的泰勒案(Thaler case)中,美国哥伦比亚特区上诉法院裁定,人工智能模型不能成为受版权保护的作品的作者。此外,美国版权局在艾伦案及其关于版权的报告中指出,人类作者不能就其使用人工智能模型创作的内容主张版权保护。如果人工智能模型或人工智能模型的人类用户都不能成为受版权保护的作品的作者,那么这些作品就属于公共领域。
这一情况的影响非同寻常。企业会失去使用人工智能生成新闻报道、歌曲、剧本、图像、视频和其他内容的重要动力。如果他们使用了超过“最低限度”的人工智能来生成这种输出,那么任何人都可以复制这些材料并免费重新分发。版权对内容生产的激励将不适用于人工智能生成的作品,这类作品的产出将会减少。
面对这些决定,内容公司可能会继续在版权局注册其作品,但放弃任何由人工智能生成的内容。电影公司可以为包含人工智能特效的电影申请版权,但不能为电影中的人工智能部分申请版权。然而,这种姿态不可避免地会限制可纳入创意作品的人工智能生成内容的数量。
如果内容公司被迫放弃其作品中超出“最低限度”的人工智能内容,那么他们最多只能获得“薄弱”的版权。音乐公司和图书出版商等版权所有者可能认为,人工智能作品缺乏版权保护,就能保护他们免受新兴商业竞争对手利用人工智能创作竞争性歌曲和书籍的侵害。但实际上,如果没有版权保护,这些新兴竞争对手利用人工智能创作竞争性作品的动力就会大大减弱,因为他们自己从这些作品中获得的收益也非常有限。他们创作的任何热门人工智能作品都会立即被免费复制和传播。
但这只是短期视角。从长远来看,成熟的内容公司希望自己利用这项技术,以目前成本的一小部分来创作高质量的内容。他们需要为这些由创意作者利用人工智能创作的作品提供版权保护。
诚然,人工智能模型并不需要版权保护来激励它们创作内容,因为它们是惰性机器,如果没有人类的提示,它们无法创作引人入胜的内容。因此,版权法不应将人工智能模型视为作品的作者;相反,它应该承认那些使用一系列提示来生成原创内容的人类才是真正的作者。
美国版权局认为,无论提示序列多么复杂,都不足以保护人工智能生成的作品,因为提示本身并不能“决定”或“控制”输出。但这似乎反映出人们对生成人工智能系统的“黑匣子”和概率特性缺乏适应,将其比作轮盘赌之类的机会驱动机器。
其他人则已经接受了生成式人工智能模型的现实。例如,有人已经开发出教人们如何撰写提示词的课程,并且已经出现了一个AI提示市场,在那里可以购买其他人的提示序列并使用它来生成购买者自己的作品。如果这些技能不能控制人工智能的输出,那又何必费心学习这些技能呢?如果即时序列不能决定人工智能输出,那又何必花钱购买它们呢?
此外,尽管美国版权局认为提示是“传达不受保护想法的指令”,但它们似乎与任何原始计算机代码一样,有资格获得版权保护。如果人工智能提示享有版权,而使用人工智能提示生成的内容却被剥夺版权,这确实很奇怪。
生成式人工智能技术的出现带来了提高艺术和创意产业中人类生产力的巨大潜力,公众利益是站在这一边的。当人类作者使用人工智能模型帮助他们创作内容时,承认版权并不是背叛,而是实现了版权的根本目的,即促进科学和实用艺术的进步。
目前的法律观点认为,人工智能生成的作品缺乏版权保护,然而这种观点并非稳固的立场。版权局、法院或立法机构迟早会允许公司保护人工智能生成的作品免遭未经授权的复制。
笔者认为,版权应基于作品的独创性,而非创作方法。
然而,中国一家法院却持不同立场。法院裁定,如果用户通过各种提示对人工智能系统进行的操作具有足够的创造性,则用户拥有其所生成图像的版权。在美国,一个合理的折衷方案或许是采取类似的立场,即当提示序列展现出足够的人类创造力时,允许用户对人工智能生成的作品享有版权。
从机器替代到劳资重构:创意工作者的“工具人”危机
拒绝对人工智能作品提供版权保护的一个意想不到的后果可能是,内容公司将不得不维持现有创意工作者的就业和薪酬水平。如果他们不能保护人工智能生成的作品免遭大规模复制,那么这些公司将无法利用人工智能生成所需的内容。他们将不得不继续以优厚的薪酬雇佣大量经验丰富的创意工作者来创作内容。
但内容创作者的充分就业和高薪并非版权的目的。解决内容产业应用人工智能带来的就业挑战,必须另辟蹊径。
如今,人工智能生成的内容远不及专业记者、编剧、视频制作人、摄影师、商业设计师和其他创意工作者的成果。但人工智能技术正在朝着这个目标迈进。工程师将与传统内容创作者携手合作,共同指导新的内容制作系统。新技术的前景是,其产出将令人满意,甚至可能更胜一筹,而成本却只是后者的一小部分。
意大利报纸《Il Foglio》最近出版了一系列报纸,其内容主要由人工智能生成。这些报纸的内容质量不佳,需要人工编辑审核是否存在造假,但这表明形势已十分严峻。未来,记者们将被期望借助人工智能来协助撰写报道。
正如很多人所说,人工智能不会取代富有创造力的工作者,但那些使用人工智能的富有创造力的工作者将会取代那些不使用的人。内容公司与内容工作者之间新安排的条款和条件将不会由版权来决定,而是由工作场所变革这一充满争议的领域中冲突的结果来决定。
这些未来安排的模式或许可以借鉴美国编剧工会与好莱坞电影公司于2023年达成的合同。根据该合同,人工智能模型永远不会被视为剧本的作者,编剧如果修改了其他工作人员使用人工智能生成的剧本初稿,将获得全额报酬和荣誉。
如果当前对变革性人工智能的预期被证明是准确的,那么未来工作面临的挑战以及人类创造力在彻底改变的工作场所中的地位将确实难以应对。全球各个政府目前还没有公共或私营机构来监督创造性工作性质的这种大规模转变。
版权在这方面对政策制定者帮助不大。现在是时候开始寻找替代的机制,以帮助缓解这种转变必然带来的痛苦,并使这种变革性技术能够以最终造福我们所有人的方式得到应用。
本文来自微信公众号:Internet Law Review,作者:马克·麦卡锡