首页 栏目首页 > 基础 > 正文

阿里云开源通义千问多模态大模型Qwen-VL


(资料图片)

阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。(科创板日报)

关键词:

最近更新

关于本站 管理团队 版权申明 网站地图 联系合作 招聘信息

Copyright © 2005-2023 创投网 - www.xunjk.com All rights reserved
联系我们:39 60 29 14 2@qq.com
皖ICP备2022009963号-3