MLCommons与Hugging Face合作发布大规模语音数据集以推动AI研究
MLCommons 与 Hugging Face 合作发布全球最大的公共领域语音数据集 ‘Unsupervised People’s Speech’,包含超过 100 万小时的音频,涵盖 89 种语言。该数据集旨在支持多语言自然语言处理研究,特别是低资源语言的语音模型改进、跨口音和方言的语音识别增强以及语音合成的新应用。然而,数据集可能存在偏见和伦理问题,如数据来源主要为美式英语,且部分录音可能未经授权。开发者需谨慎使用,MLCommons 承诺持续更新和改进数据集质量。