据 IT 之家 6 月 25 日报道,AI 创业公司 MosaicML 近日发布了其语言模型 MPT-30B,该模型具有 300 亿参数,训练成本“仅有其他同类竞品模型的零头”,有望促进行业逐步降低此类模型训练成本,扩大 AI 模型在更广泛领域的运用。 MosaicML 公司的首席执行官兼联合创始人 Naveen Rao 表示,MPT-30B 的训练成本为 70 万美元(约 502.44 万元人民币),远低于 GPT-3 等同类产品所需的数千万美元训练成本。此外,由于 MPT-30B 的成本较低,体积较小,它也可以更快速地被训练,并且更适合部署在本地硬件上。 据悉,MosaicML 使用了 Alibi 和 FlashAttention 技术来优化模型,可以实现更长的文本长度和对 GPU 计算的更高利用率。MosaicML 也是少数几个能够使用 Nvidia H100 GPU 的实验室,相比以往成果,当下每块 GPU 的吞吐量增加了 2.4 倍以上,可带来更快的完成时间。 原文链接 —- 编译者/作者:东寻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
AI 公司 MosaicML 推出 300 亿参数模型 MPT-30B,并称训练成本仅为竞品零头
2023-06-25 东寻 来源:区块链网络
LOADING...
相关阅读:
- Midjourney 再次惊艳 AI 社区,新版本能够像相机一样自由变焦2023-06-25
- 黄仁勋称英伟达“极有可能”在欧洲投资2023-06-25
- AI笔电或带动新一波换机潮,业界预期最快2024年开始发酵2023-06-25
- 索尼音乐聘请 BPI 专家 Geoff Taylor 担任人工智能执行副总裁2023-06-24
- AI入局世界网球温布顿锦标赛,可分析赢球概率及生成球评2023-06-23