据金十 7 月 28 日报道,海天瑞声今日宣布正式推出中文千万轮对话语料库 DOTS-NLP-216。据介绍,该语料库更加符合中国人表达习惯的自然对话数据集,共计约千万轮,上亿级 token,包含正式 & 非正式风格对话,使用偏口语化自然表达,覆盖工作、生活、校园等场景,及金融、教育、娱乐、体育、汽车、科技等领域。在数据集构成上,DOTS-NLP-216 包含了对真实场景的对话采集,及高度还原真实场景的模拟对话两种方式。 —- 编译者/作者:Yangz 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
海天瑞声发布超大规模中文对话数据集 DOTS-NLP-216
2023-07-28 Yangz 来源:区块链网络
LOADING...
相关阅读:
- WPS AI 海外版开启公测,由 OpenAI 和 PaLM2 提供大模型支持2023-07-27
- 上海市消保委:AI 拍照软件“妙鸭相机”不支持退款涉嫌侵害消费者的2023-07-26
- 苹果将于 8 月在上海等地举办开发者活动,可线下体验 VisionPro 头显2023-07-26
- 海天瑞声:大模型高质量数据需要高质量人工支持2023-07-24
- 松下控股宣布旗下海外公司也可使用聊天 AI2023-07-22