据品玩 9 月 22 日报道,据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2 seq 模型。 据悉,OpenBA 是一款具有 150 亿参数的双语非对称 seq2 seq 模型,也是首个加入中国开源模型社区的大语言模型变体。论文显示,研究者采用高效的技术以及采用三阶段的训练策略,从头开始训练了 OpenBA 模型。 实验显示,OpenBA 在 BELEBELE 基准测试中的性能优于 LLaMA-70 B,在 MMLU 基准测试中的性能优于 BLOOM-176 B,在 C-Eval(hard)基准测试中的性能优于 GLM-130 B。 原文链接 —- 编译者/作者:Kyle 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
苏州大学推出开源大模型 OpenBA,具备150亿参数
2023-09-22 Kyle 来源:区块链网络
LOADING...
相关阅读:
- 新石器成立机器人公司,含多项 AI 软件开发业务2023-09-22
- 数字工作流领先者 ServiceNow 发布 Now Assist 企业 AI 套件2023-09-22
- 万兴科技将与华为云在数字人、AI 大模型等方面深入合作2023-09-22
- 彩讯股份:B 端 C 端未来都会是公司 AI 邮箱要覆盖的市场2023-09-22
- 微软 Win11 画图应用引入 Cocreator 图片生成功能2023-09-22