Meta AI 推出多语言阅读理解数据集 Belebele
时间:2023-09-04 来源:区块链网络 作者:东寻
据品玩 9 月 4 日报道,Meta AI 近日宣布,推出一款名为 Belebele 的多语言阅读理解数据集,可以直接比较模型对不同语言的理解程度。 Belebele 其中涵盖了 122 种语言,可以评估高、中、低资源语言的单语言和多语言模型。该数据集由基于 FLORES-200 段落的精心设计的多项选择题和答案组成,能够以高资源和低资源语言评估 NLP 系统和大型语言模型。由于 Belebele 是完全并行的,因此可以直接比较所有语言的模型性能。 原文链接 |
知识: AIGC