开云kaiyun体育咱们这就亲手尝试一番-kaiyun全站体育app下载

2026-05-04 07:42 点击次数：196

阿里又发了个特真义的大模子——开云kaiyun体育

QVQ-Max，初版视觉推理模子，对自便图像或视频都不错进行深度想考。

举个真义的例子，上传一张你的手掌，再点击Thinking，QVQ-Max 就不错给你看手相：

不错看到，在深度想考事后，QVQ-Max 就开动迟缓分析手掌上的线条和其他特征。

包括心线、头线、生命线等主要线条的分析，以及限定手指上的金限定的记号意旨。

这还只是一个相比有文娱性的例子。

如果你衔接给 QVQ-Max "喂"多张图片，它也不错进行深度想考：

这两张图片形色了哪些征象？它们之间的关系是什么？

在一顿想考事后，QVQ-Max 准确地识别出两张图揣度——都是西湖的征象，但一张是春夏时节，另一张是冬季。

再如数学推理，相似是给它"喂"一张图即可，连发问都省了：

在想考之后，QVQ-Max 是找到了数字们之间的法令，并最终给出了正确谜底：10。

以及径直上传一个手绘简笔画视频，并附上一句：

分析视频，将视觉本色与翰墨连络，并为视频中的镜头创建机动真义的字幕。

最终，QVQ-Max 依旧是稳稳地完成了任务。

网友们看罢，亦然麻溜地去试了试。

不外这一次，QVQ-Max 有点小翻车——路飞是认对了，但这个乔巴……

以及啊，这两天被 OpenAI GPT-4o 图像生成带火的吉卜力，网友们亦然跟上了：

那么 QVQ-Max 的图像视频深度想考实力到底怎样，咱们这就亲手尝试一番。

实测 QVQ-Max

领先，咱们仍是来测试一下 QVQ-Max 看图解数学题的才智。

题目是这么的：

然后咱们发问：

这谈题的谜底是若干？

在深度想考事后，QVQ-Max 不仅精确识别出了手写的题目，何况给出了正确谜底：2。

刚才 Qwen 官方给出了看手相的例子，此次咱们再来"喂"下这张图：

问题是这么的：

这是什么？

嗯，是相比全面地先容了星盘。

接下来，咱们再来测试一下视频推理，例子就用 Anthropic 最新发布的一个：

如若刨去视频里的布景音，单是看本色，仍是相比综合的。

对此，QVQ-Max 给出的表示是：

从不雅察到推理

除了服从除外，天然 Qwen 团队莫得公布关系论文，但关于背后的工夫亮点，团队仍是浅陋的先容了一番。

领先，团队在 MathVision 这个 benchmark（网罗各样贵重多模态数学）上进行了一番测试：

适度标明，通过调养模子 thinking 的最大长度，模子在 MathVision 上的准确率也会捏续擢升。

除此除外，团队还回归了 QVQ-Max 的三大才智本性。

包括对图片的瓦解才智绝顶强，岂论是复杂的图表仍是曩昔生存中唾手拍的像片，它都能快速识别出关节元素。比如，它不错告诉你一张像片里有哪些物品、有什么翰墨标志，以至还能指出一些你可能忽略的小细节。

只是识别出图片里的本色还不够，QVQ-Max 还能进一步分析这些信息，并连络布景常识得出论断。

举例，在一谈几何题中，它不错把柄题目附带的图形推导出谜底；在一段视频里，它能把柄画面本色揣测出接下来可能发生的情节。

除了分析和推理，QVQ-Max 还能作念一些真义的事情，比如帮你筹议插画、生成短视频剧本，以至把柄你的需求创作变装上演的本色。

如果你上传一幅草稿，它可能会帮你完善成一幅齐全的作品；上传一个曩昔像片，它不错化身薄情的驳倒家，占卜师。

值得平缓的是，QVQ-Max 是免费可用的哦，感敬爱敬爱的一又友快去试试吧 ~

体验地址：

https://chat.qwen.ai

参考贯穿：

[ 1 ] https://qwenlm.github.io/zh/blog/qvq-max-preview/

[ 2 ] https://x.com/Alibaba_Qwen/status/1905342260100956210

一键三连「点赞」「转发」「着重心」

接待在驳倒区留住你的意见！

— 完 —

速抢席位！中国 AIGC 产业峰会不雅众报名通谈已开启 � � ‍♀️

首批嘉宾曝光啦 � � 百度、无问芯穹、数势科技、生数科技、像素绽放等十数位 AI 领域创变者将皆聚峰会，让更多东谈主用上 AI、用好 AI，与 AI 一同加快成长～

4 月 16 日，就在北京，统共来深度求索 AI 怎样用 � �

� � 一键星标 � �

科技前沿发达逐日见开云kaiyun体育

新闻动态

开云kaiyun体育咱们这就亲手尝试一番-kaiyun全站体育app下载