摘要
机器学习是人工智能的关键技术,包括输入、学习与输出三个过程,需要以大量资料作为训练数据,但在获取、使用受著作权法保护的作品时可能侵犯他人著作权。严苛的著作权保护模式在一定程度上将阻碍机器学习技术的发展与应用,反之,过于宽松的著作权保护模式将抑制作者的创作激情。利益平衡理论要求著作权制度在保护著作权人利益时应考虑社会公共利益,为机器学习技术的发展与应用让渡一定空间。相较于合理使用制度的倾斜保护,法定许可制度能兼顾各方利益,实现技术发展与文化创新的平衡。
引文
[1]此处的数据(Data)并非是狭义的数字数据,而是广义上的数据,是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的材料,包括但不限于声音、图像、文字等。
[2]Arthur.L.Samuel.“Some Studies in Machine Learning Using the Game of Checkers”,3(3)IBM Journal of Research and Development 210,211(1959).
[3]Tom M.Mitchell.Machine Learning(McGraw-Hill International Editions Computer Science Series)(1st ed.).WCB/McGrawHill Company Inc.,1997,p.1.
[4]Trevor Hastie,Robert Tibshirani,Jerome Friedman.The Elements of Statistical Learning:Data Mining,Inference,and Prediction.Springer Science+Bussiness Media,LLC.,2001,p.11.
[5]Christopher M.Bishop.Pattern Recognition and Machine Learning(Information Science and Statistics).Springer Science&Bussiness Media,LLC.,2006,p.11.
[6]Stephen Marsland.Machine Learning:An Algorithmic Perspective.Chapman and Hall/CRC,2009,p.10.
[7]Prof Nils J.Nilsson,The Quest for Artificial Intelligence:A History of Ideas and Achievements,Cambridge Univ.Press,2010,p.15.
[8]曹昊:《机器学习中的数据清洗与特征处理综述》,https://tech.meituan.com/machinelearning-data-feature-process.html.,2017年11月17日访问。
[9]“爬虫协议”(也称为Robots协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不可抓取。Robots协议的本质是网站和搜索引擎爬虫的沟通方式,用来指导搜索引擎更好地抓取网站内容,而不是作为搜索引擎之间互相限制和不正当竞争的工具。它是互联网领域普遍认知和接受的行为标准,具有公认性和一般性,属于公认的商业道德,对这一行业基本准则的违反属于违反互联网行业的商业道德,因此也会构成侵权。参见张平:《〈反不正当竞争法〉的一般条款及其适用--搜索引擎爬虫协议引发的思考》,载《法律适用》2013年第3期。
[10]杨华权:《论爬虫协议对互联网竞争关系的影响》,载《知识产权》2014年第1期。
[11](2012)一中民初字第5718号。
[12]参见祝文明:《百度诉奇虎360违反Robots协议案一审有果》,《中国知识产权报》2014年08月13日第10版。
[13]《信息网络传播权保护条例》第26条第2款。
[14]参见王迁:《版权法保护技术措施的正当性》,载《法学研究》2011年第4期。
[15]BAT(百度、阿里巴巴集团和腾讯公司)的服务条款。参见《百度用户协议》,https://passport.baidu.com/static/passpcaccount/html/protocal.html,2017年11月20日访问;参见《腾讯用户协议》,http://ctc.qzs.qq.com/qzone/photo/portal/poly_agreement.shtml,2017年11月20日访问;参见《阿里巴巴服务条款》,http://terms.alicdn.com/legal-agreement/terms/suit_bu1_b2b/suit_bu1_b2b201703271338_74297.html?spm=a211h4.10560363.0.0.4e1c659eNb4VvL,2017年11月20日访问。
[16]参见吴汉东:《知识产权的私权与人权属性--以〈知识产权协议〉与〈世界人权公约〉为对象》,载《法学研究》2003年第3期。
[17]此处的复制行为不同于训练数据输入阶段的复制行为,两者的目的是不同的。训练数据输入阶段的复制主要是讲作品复制以便程序或模型可以使用,倘若未经许可构成侵权;学习过程中的复制行为更多的是在机器处理训练数据中的必要的中间环节,分为临时复制和非临时复制。后文将对机器学习过程中的复制是否构成侵权进行详细论述。
[18]参见冯晓青:《网络环境下私人复制著作权问题研究》,载《法律科学(西北政法大学学报)》2012年第3期;王迁:《版权法保护技术措施的正当性》,载《法学研究》2011年第4期。
[19]Sobel,Benjamin L.W.,“Artificial Intelligence’s Fair Use Crisis”.41(1)Columbia Journal of Law&the Arts,Forthcoming,45,49(2017).
[20]参见吴汉东:《人工智能时代的制度安排与法律规制》,载《法律科学(西北政法大学学报)》2017年第5期;易继明:《人工智能创作物是作品吗?》,载《法律科学(西北政法大学学报)》2017年第5期;刘影:《人工智能生成物的著作权法保护初探》,载《知识产权》2017年第9期;梁志文:《论人工智能创造物的法律保护》,载《法律科学(西北政法大学学报)》2017年第5期;王文亮、王连合:《将法律作为修辞视野下人工智能创作物的可版权性考察》,载《科技与法律》2017年第2期;熊琦:《人工智能生成内容的著作权认定》,载《知识产权》2017年第3期。
[21]参见王迁:《论人工智能生成的内容在著作权法中的定性》,载《法律科学(西北政法大学学报)》2017年第5期。
[22]世界知识产权组织编:《知识产权纵横谈》,世界知识产权出版社1992年版,第21页。
[23]参见吴汉东:《人工智能时代的制度安排与法律规制》,载《法律科学(西北政法大学学报)》2017年第5期。
[24]参见梁志文:《论人工智能创造物的法律保护》,载《法律科学(西北政法大学学报)》2017年第5期。
[25]参见熊琦:《人工智能生成内容的著作权认定》,载《知识产权》2017年第3期。
[26]参见易继明:《人工智能创作物是作品吗?》,载《法律科学(西北政法大学学报)》2017年第5期。
[27]Sobel,Benjamin L.W,“Artificial Intelligence’s Fair Use Crisis”,41(1)Columbia Journal of Law&the Arts,Forthcoming,45,62(2017).
[28]冯晓青:《知识产权法利益平衡理论》,中国政法大学出版社2006年版,第45页。
[29]Stallman,Richard.“Reevaluating Copyright:The Public Must Prevail”,75(1)Oregon Law Review 291,295(1996).
[30]唐思慧:《大数据环境下文本和数据挖掘的版权例外研究--以欧盟〈DSM版权指令〉提案为视角》,载《知识产权》2017年第10期。
[31]参见梁志文:《论人工智能创造物的法律保护》,载《法律科学(西北政法大学学报)》2017年第5期。
[32]Sobel,Benjamin L.W.,“Artificial Intelligence’s Fair Use Crisis”.41(1)Columbia Journal of Law&the Arts,Forthcoming,45,93(2017).
[33]美国《版权法》107条规定的合理使用“四要素”有:1.使用的目的和性质,包括该使用是否具有商业性,抑或是非盈利的教育性目的;2.版权作品的属性;3.对于整个版权作品的使用数量和程度;4.使用对版权作品的潜在市场或价值的影响。17 U.S.C.A.§107.Limitations on exclusive rights:Fair use.
[34]参见冯晓青、胡梦云:《合理使用视野下“私人复制”著作权问题研究》,载《南都学坛》2011年第6期。
[35]狭义来讲,区块链是一种按照时间顺序将数据区块以链条的方式组合成特定数据结构,并以密码学方式保证的不可篡改和不可伪造的去中心化共享总账(Decentralized shared ledger),能够安全存储简单的、有先后关系的、能在系统内验证的数据。广义的区块链技术则是利用加密链式区块结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用自动化脚本代码(智能合约)来编程和操作数据的一种全新的去中心化基础架构与分布式计算范式。参见袁勇、王飞跃:《区块链技术发展现状与展望》,载《自动化学报》2016年第4期。
[36]European Parliament Resolution of 16 February 2017 with Recommendations to the Commission on Civil Law Rules on Robotics(2015/2103(INL)),http://www.europarl.europa.eu/sides/getDoc.do?type=TA&reference=P8-TA-2017-0051&language=EN&ring=A8-2017-0005,accessed December 29,2018.
[37]Kevin J.Delaney.,The Robot That Takes Your Job Should Pay Taxes,Says Bill Gates,QUARTZ(Feb.17,2017),https://qz.com/911968/bill-gates-the-robot-that-takes-your-job-should-pay-taxes/,accessed December 29,2018.