2025春节档预售票房破10亿 肖战《射雕英雄传:侠之大者》超3亿领跑
12-09
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
12-09
12-09
度小满与联合国开发计划署推出“可持续金融助力乡村振兴”项目 为乡村振兴赋能
12-09
12-09
12-09
抖音纪录片《岁岁年年 再出发》春节上线 与刘震云等一起探索人工智能
12-09
12-09
12-09
12-09
12-09
12-09
ADADADADAD
阿里,视觉,开源
2025春节档预售票房破10亿 肖战《射雕英雄传:侠之大者》超3亿领跑
12-09
英伟达回应股价遭DeepSeek暴击:DeepSeek是出色的AI进步
12-09
12-09
度小满与联合国开发计划署推出“可持续金融助力乡村振兴”项目 为乡村振兴赋能
12-09
12-09
12-09
抖音纪录片《岁岁年年 再出发》春节上线 与刘震云等一起探索人工智能
12-09
12-09
12-09
12-09
12-09
12-09
字典百科网(zdbk.com)1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中
以下为本文的正文内容,请查阅,本站为公益性网站,复制本文以及下载DOC文档全部免费。
字典百科网(zdbk.com)1月28日消息,今天,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。
其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得视觉理解冠军,超越GPT-4o与Claude3.5。
官方介绍称,新的Qwen2.5-VL能更准确地解析图像内容,突破性地支持超1小时的视频理解,可以在视频中搜索具体事件,并对视频的不同时间段进行要点总结,从而快速、高效地帮助用户提取视频中蕴藏的关键信息。
而且无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。
Qwen2.5-VL 不仅擅长识别常见物体,如花、鸟、鱼和昆虫,还能够分析图像中的文本、图表、图标、图形和布局。
此外,Qwen2.5-VL将OCR识别能力提升至一个新的水平,增强了多场景、多语言和多方向的文本识别和文本定位能力。同时,在信息抽取能力上进行大幅度增强,以满足日益增长的资质审核、金融商务等数字化、智能化需求。
10-26
10-26
10-27
10-23
10-26
10-25
10-25
10-25
10-24
10-25
10-23
10-23
10-25
10-26
10-28
10-29