据 IT 之家 7 月 20 日消息,人工智能公司 Cohere 首席执行官 Aiden Gomez 近日透露,由于 Reddit、Twitter 等公司的数据采集要价太高,包括微软、OpenAI 和 Cohere 在内的 AI 公司,已使用合成数据来训练 AI 模型。 Gomez 表示合成数据可以适用于很多训练场景,只是目前尚未全面推广。Gomez 举例称:如果某个企业想在高等数学中训练一个模型,可以创建两个人工智能模型,分别扮演老师和学生的角色,并让它们讨论三角学之类的话题。人工主要负责观察,如果看到有什么错误,可以进行纠正。 据悉,合成数据(synthetic data)是通过计算机技术人工生成的数据,而不是由真实事件产生的数据。但合成数据具备“可用性”,能够在数学上或统计学上反映原始数据的属性,因此可以作为原始数据的替代品来训练、测试并验证大模型。 原文链接 —- 编译者/作者:东寻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
推特等公司要价太高,OpenAI 和 Cohere 等 AI 公司转向合成数据
2023-07-20 东寻 来源:区块链网络
LOADING...
相关阅读:
- OpenAI 将 ChatGPT Plus 客户可发送到 GPT-4 的消息数量增至每 3 小时 50 次2023-07-20
- 亚马逊云科技:已支持 Meta 推出的最新 Llama 2 基础模型2023-07-19
- AI 初创公司 Cognaize 完成 1800 万美元融资,旨在为金融业打造更好的 LL2023-07-19
- 百度集团副总裁吴甜:文心大模型 3.5 能力已经超出 ChatGPT 3.52023-07-19
- 詹姆斯?卡梅隆:AI 的武器化是最大的危险2023-07-19