阿里云周靖人:全新开源大模型 Qwen-14B 提供更强大的认知等能力
时间:2023-09-25 来源:区块链网络 作者:东寻
据 36 氪 9 月 25 日报道,阿里云智能首席技术官周靖人在通义千问开源发布会上宣布,将全新开源性能更强的大模型 Qwen-14B,该模型基于 140 亿参数,3 万亿 token 训练的开源大模型提供更强大的推理、认知、规划和记忆能力。此外,相比之前的开源版本,新的 QWEN-7B(v1.1)模型能力普遍提升,核心指标最高提升 22.5%。 原文链接 |
知识: