据证券时报报道,7 月 8 日,在由上海数据交易所、大数据流通与交易技术国家工程实验室承办的“大模型时代下的数据要素流通”主题论坛上,上海数交所总经理汤奇峰作题为“大模型时代下的语料库”的主旨演讲,带来关于国内语料库建设挑战的观察,并从语料库质量和开放程度两个维度给出建设建议。汤奇峰认为大模型时代下的语料库建设存在语料库供给不足、语料库质量不高、语料库多样性匮乏、语料库标准欠缺等问题。当天活动上,上海数交所正式启动语料数据生态创新合作伙伴计划,携手首批合作伙伴丰富语料库,推动数据要素市场建设。 关于语料库建设的挑战,汤奇峰认为主要集中于开放程度和数据质量两方面:“能否有大模型企业所需的高质量语料?目标对象愿不愿意开放数据?”由此,汤奇峰指出可以根据开放程度强弱和数据质量高低将语料数据生态机构分出四类供方。 上海数交所官网已经于 7 月 7 日正式上线语料库,累计挂牌近 30 个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。 原文链接 —- 编译者/作者:Yangz 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
上海数交所总经理汤奇峰:构建大模型时代语料库数据生态,推动数据要素市场
2023-07-09 Yangz 来源:区块链网络
LOADING...
相关阅读:
- 上海数交所总经理汤奇峰:构建大模型时代语料库数据生态,推动数据2023-07-09
- 天壤发布通用大语言模型、语义搜索引擎等三款产品2023-07-09
- 中信期货首席信息官余以志:期货市场可作为 AI 技术迭代升级和示范应2023-07-08
- 2023 世界人工智能大会闭幕,32 个重大产业签约,总额达 288 亿元2023-07-08
- 中国移动:正筹划 AI+X 产品和应用2023-07-08