通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上等兵

注册:2022-4-24
跳转到指定楼层
1#
发表于 2024-1-16 11:12:38 |只看该作者 |倒序浏览
Meta(前身为 Facebook)就因使用包含大量盗版书籍的“Books3”数据集训练其 LLAM 1 和 LLAM 2 模型而面临包括喜剧演员 Sarah Silverman 和作家 Richard Kadrey 在内的一众作者的集体诉讼。Meta 虽承认使用了 Books3 数据集,却拒绝向作者支付适当的补偿。Books3 是一个包含 19.5 万本图书、总容量近 37GB 的文本数据集,由 AI 研究者 Shawn Presser 于 2020 年创建,旨在为改进机器学习算法提供更好的数据源。Meta 也将其用于训练自己的 LLAM 模型,然而 Books3 中包含大量从盗版网站 Bibliotik 爬取的受版权保护作品,使得 Meta 的行为面临法律风险。

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-11-21 22:15 , Processed in 0.096594 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部