MLCommons与Hugging Face合作发布大规模语音数据集以推动AI研究

MLCommons 与 Hugging Face 合作发布全球最大的公共领域语音数据集 ‘Unsupervised People’s Speech’，包含超过 100 万小时的音频，涵盖 89 种语言。该数据集旨在支持多语言自然语言处理研究，特别是低资源语言的语音模型改进、跨口音和方言的语音识别增强以及语音合成的新应用。然而，数据集可能存在偏见和伦理问题，如数据来源主要为美式英语，且部分录音可能未经授权。开发者需谨慎使用，MLCommons 承诺持续更新和改进数据集质量。

来源：TechCrunch AI