明晰合理使用边界 促进AI产业发展
摘要:人工智能是发展新质生产力的重要驱动力,生成式人工智能在推动文化繁荣发展方面也发挥着重要功能。我国著作权法尚未将用于人工智能模型训练的作品使用行为纳入合理使用范畴。
使用海量文本、图片、音乐、视频等作品进行模型训练并以此掌握学习内容的“内在规律”,是人工智能产生生成能力的必要前提,也是支撑生成式人工智能系统不断优化更新的重点。作为训练数据来源的被使用作品不仅包括已经进入公共领域的作品,还包括大量尚处于保护期限内的作品。此类作品使用行为则可能会因未经著作权人许可而构成侵权,也可能会因未影响作品正常使用、未不合理地损害著作权人合法权益而被认定为合理使用。如何正确认定前述作品使用行为,以顺应人工智能技术的发展,是当前理论探讨和司法实践中关注的焦点。
人工智能是发展新质生产力的重要驱动力,生成式人工智能在推动文化繁荣发展方面也发挥着重要功能。我国著作权法尚未将用于人工智能模型训练的作品使用行为纳入合理使用范畴。对此,笔者认为,人工智能产业发展的方向和趋势已经逐步明晰,应当秉持着更为开放包容的态度,先在司法裁判中总结个案经验,而后逐步上升至立法层面予以明确规定,最终形成人工智能产业促进型著作权合理使用制度的改进路径。
与时俱进适应发展
目前,我国著作权法第二十四条对合理使用制度进行了列举式规定,而人工智能使用受著作权法保护的作品进行数据训练的行为难以解释为“为个人学习、研究或者欣赏,使用他人已经发表的作品”或“为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品”等情况。这可能会导致模型训练过程中的作品使用行为被认定构成侵权,从而使得人工智能模型训练者承受诉讼负担,面临过高的研发风险进而降低研发的积极性。
合理使用制度的立法本质是基于社会公众的作品合理使用权而对著作权进行的限制,其判定标准应随着技术发展而有所变化,从而保障社会公众能够利用人工智能实现文化成果收益分享等基本权利。从这一角度出发,对合理使用制度能否变革的认识,应当以社会公众的文化权利作为出发点和落脚点,其是旨在实现社会智力成果以公平方式分配的利益平衡原则的外化体现。而我国当前对著作权合理使用制度的认知还存在基于“义务视角”考察的现象,对此,应当将认知模式转变为社会公众合理使用的“权利视角”加以考察。
近年来,不少国家先后在其著作权法合理使用制度中增设了文本和数据挖掘版权例外(TDM例外)规则,或者是在个案中认可文本数据挖掘行为构成合理使用。对于类似的人工智能系统未经许可使用他人作品用于数据训练的行为,我国著作权法合理使用制度尚未进行明确规定。笔者认为,人工智能系统使用处于保护期内作品进行数据训练的行为属于非表达性作品使用行为,不会构成对作者的潜在竞争,合理使用制度应当对该行为予以认可。目前,著作权法对合理使用制度采取了封闭列举的方式,在司法实务中给予法官的自由裁量空间过小,不利于法院在个案认定中结合技术发展情况予以灵活解释,进而引领规则的变革和升级。
优化规则促进创新
北京互联网法院审结的“人工智能文生图第一案”,明确了利用人工智能生成图片的“作品”属性和使用者的“创作者”身份,对于人工智能生成内容的独创性问题给出了答案。人工智能“文生文”“文生图”“图生图”“文生视频”等生成模式日益发达,除对生成的内容结果进行客体界定外,还需要对人工智能系统生成前的学习过程构成著作权侵权抑或是属于合理使用这一问题予以回应。对此,笔者认为,应当进一步优化合理使用制度并完善相应的配套机制,以实现著作权法对人工智能技术发展的回应。
目前,与人工智能系统使用作品进行模型训练相关度较高的现行法依据为著作权法第二十四条第(一)项及第(六)项,法条将合理使用的主体限定为个人,合理使用的目的限定为供教学或科研人员使用且不得发行。然而实践中,人工智能在挖掘已发表作品进行数据训练时,使用主体通常并非是个人,而是非商业性人工智能研发组织或商业性人工智能技术开发公司;使用过程也有别于人类的阅读,是由人工智能机器以类似于“阅读”的方式将作品数据化后,再进行海量数据对比、分析的复杂处理;使用后的目的也并非现行合理使用制度中所禁止的复制、发行和传播,而是经由算法对海量学习内容进行分析、处理后生成出符合独创性的新作品。
因此,笔者认为,将人工智能模型训练纳入著作权合理使用制度时,应区分非商业性使用和商业性使用。对于非商业性使用,应当包含以下要点:使用主体不局限于自然人,而是一切以科学研究等非商业性使用为目的的主体;使用目的为自己使用或向科研目的等非商业性目的的主体提供数据集合;使用行为则为以文本数据挖掘为目的进行临时复制。商业性使用有所不同,其应当包括以下要点:使用主体是以商业性使用为目的的主体;使用前提是被使用作品的权利人未以机器可识别的方式事先作出拒绝使用的声明;使用目的必须是不对原作品作者构成市场替代的非表达性使用或转换性使用。
在此基础上,笔者建议构建特殊补偿机制,以及明确法官在个案中认定合理使用和著作权侵权“实质性相似”时是相互独立进行的。合理使用制度的边界是,基于社会公众享有的文化权利而对作者的著作权作出的限制,并且由此产生的类型化合理使用行为不得对作品构成市场替代。但是,人工智能系统通过文本数据挖掘实质上是代替行使了社会公众的部分文化权利,而这一过程往往会造成作者著作财产权和精神权利的损失。对此,可以在著作权集体管理组织协调下,设置补偿金机制,并强调人工智能系统数据训练者应当披露所学习的作品,以维护作者的精神权利。在司法实践中,法官进行人工智能是否为合理使用的认定往往与著作权侵权认定密切相关。在人工智能合理使用制度得到完善后,二者间的认定应当得到分离。即在合理使用制度框架下,由法官认定人工智能进行数据训练时是否逾越了合理使用范围,而在著作权侵权认定框架下,由法官对于被诉侵权作品与被侵权作品是否构成了“实质性相似”进行认定。二者在认定时相互分离,一方面,能够及时制止侵权,并弥补著作权人的损失;另一方面,能够避免人工智能训练模型被认定整体侵权进而导致训练使用的数据库被要求删除,从而造成过高的训练成本。(刘皓阳 作者系北京大学法学院博士研究生)
版权声明
凡注明"来源:中国知识产权网"的所有文字、图片和音视频资料,版权均属中国知识产权网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发布/发表。已经本网协议授权的媒体、网站,在下载使用时必须注明"稿件来源:中国知识产权网",违者本网将依法追究责任。