Meta 因使用盗版数据集 LibGen 训练 Llama 大语言模型面临版权诉讼。诉讼文件显示,Meta CEO 扎克伯格批准使用该数据集,尽管公司内部对版权风险存在担忧。Meta 被指控通过删除版权信息掩盖侵权行为,并采用 torrent 技术获取数据。此案凸显了 AI 模型训练中数据来源合法性的关键挑战,以及大模型开发与版权保护的复杂平衡。 来源:TechCrunch AI