阿里云开源通义千问多模态大模型 Qwen-VL

时间:2023-08-25 来源:区块链网络作者:东寻

据《科创板日报》报道，阿里云今日推出大规模视觉语言模型 Qwen-VL，并对其直接开源。Qwen-VL 以通义千问 70 亿参数模型 Qwen-7B 为基座语言模型研发，支持图文输入。相较于此前的 VL 模型，Qwen-VL 除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力，可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。

原文链接

知识： AIGC

阿里云开源通义千问多模态大模型 Qwen-VL

时间:2023-08-25 来源:区块链网络 作者:东寻

时间:2023-08-25 来源:区块链网络作者:东寻