据《科创板日报》报道,阿里云今日推出大规模视觉语言模型 Qwen-VL,并对其直接开源。Qwen-VL 以通义千问 70 亿参数模型 Qwen-7B 为基座语言模型研发,支持图文输入。相较于此前的 VL 模型,Qwen-VL 除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。 原文链接 —- 编译者/作者:东寻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
阿里云开源通义千问多模态大模型 Qwen-VL
2023-08-25 东寻 来源:区块链网络
LOADING...
相关阅读:
- 生成式人工智能:发展演进及产业机遇2023-08-25
- 华硕:预计明年人工智能服务器业务至少翻倍增长2023-08-25
- 浪潮信息发布大模型智算软件栈 OGAI2023-08-24
- 高盛:企业通过 AI 取代人类工作岗位可提升 20% 利润2023-08-24
- 爱奇艺公布引入 AIGC 辅助剧本评估2023-08-24