阿里通义大模型团队正式开源推出 qwen3-vl-embedding 与 qwen3-vl-reranker 模型家族。该系列基于强大的 qwen3-vl 多模态基础模型构建,专为多模态信息检索和跨模态语义理解任务深度优化,面向图文、视频及混合内容场景,提供统一、高性能的端到端解决方案。
两大模型均支持在统一框架下处理文本、图像、可视化文档(如图表、代码片段、UI界面元素等)以及视频等多种输入形式。在图文跨模态检索、视频-文本对齐、视觉问答(VQA)、多模态聚类等广泛任务中,性能全面达到行业前沿水准。
Qwen3-VL-Embedding 充分融合 Qwen3-VL 的强大表征能力,可生成高语义保真度的联合向量表示,将视觉与语言信号映射至共享语义空间,从而支撑高效、精准的跨模态相似性建模与快速检索。
图1:多模态统一语义空间示意。Qwen3-VL-Embedding 将文本、图像、视觉文档与视频等异构数据统一编码至同一高维语义向量空间。
作为 Embedding 模型的重要增强组件,Qwen3-VL-Reranker 支持任意模态组合的查询-文档对(例如:图文查询匹配图文文档),并输出精细化的相关性打分。在典型应用流程中,二者形成协同闭环:Embedding 实现大规模初筛召回,Reranker 完成细粒度相关性精排,共同构成“两阶段检索范式”,显著提升最终结果质量与用户体验。
本系列完整继承 Qwen3-VL 的多语言理解能力,覆盖超30种语言,满足全球化业务部署需求。同时提供灵活的向量维度配置、可定制的任务指令模板,并在量化压缩后仍保持优异性能,极大降低集成门槛与推理开销。
Qwen3-VL-Embedding 与 Qwen3-VL-Reranke
r 在架构设计上各具侧重,分别针对检索链路中的不同环节进行专项优化。
图 2:Qwen3-VL-Embedding 与 Qwen3-VL-Reranker 架构对比示意图。左侧为双塔独立编码结构,右侧为单塔交叉注意力结构。
Qwen3-VL-Embedding 采用双塔编码架构,支持不同模态内容的并行独立编码,生成统一语义向量,特别适用于海量数据下的高吞吐、低延迟检索场景。
Embedding 模型可接收单模态或混合模态输入,并将其映射为固定维度的语义向量。具体实现中,我们提取基座模型最后一层对应 [EOS] token 的隐藏状态作为整体输入的语义表征,兼顾表达能力与计算效率,保障大规模检索系统的实时响应能力。
Qwen3-VL-Reranker 采用单塔联合编码架构,依托内置的交叉注意力机制,对查询与文档进行深度交互建模,充分挖掘跨模态细粒度关联,最终输出高置信度的相关性评分。
Reranker 模型以 (Query, Document) 对为输入单元,执行联合前向传播。通过基座模型内部的交叉注意力模块,实现 Query 与 Document 之间的双向、多层次语义对齐与信息互补。模型最终基于两个特殊 token(yes / no)的生成概率分布,推导出该输入对的相关性得分。
GitHub 仓库:
https://www./link/2b7f3676262f189cbb4e3454f6330155
魔搭 ModelScope:
https://www./link/ad5dae030351324d7b709be52a633081
https://www./link/d23941275ef524a546d5921aa8c5af2d
源码地址:点击下载
# embedding
# 点击下载
# 细粒度
# 两大
# 并在
# 适用于
# 闭环
# 基座
# 文档
# 多模
# 模态
# git
# ui
# https
# 继承
# Token
# 架构
# qwen
# 大模型
# 多语言
# 编码
# github
相关文章:
首发999元起!KT R2复古掌机正式发布:双比例屏可选+天玑7300
小米“Ultra”系列演进图谱:每代旗舰背后的核心突破
清华系公司清微智能放言:明年国产AI芯片有望超越国际高端芯片 对标H100
刘知远:2030—2035 年可实现 AGI
弗尔夫人日月印记流:无限轰炸核心技巧
新手秒变老鸟:武器大师教你三连暴击通关秘籍
《*娘》玩家呼吁加入美国*界 官方似乎正在酝酿中
AI 浪潮正推动年轻人涌入建筑业“淘金”
剑侠江湖全攻略!现世蜃境剑林玩法 + 战斗秘籍大公开
《天穗之咲稻姬》时隔三年发布更新 续作明年发售
英伟达高管:日本不再是机器人大国 落后中美等国
30万级别的“全能选手”?沃尔沃全新XC70值得考虑
荣耀WIN系列发布:骁龙8系平台+首发185Hz游戏适配
荣耀与三角洲行动职业联赛达成战略合作,共筑顶尖电竞生态体验
德意志飞机2025答卷:D328eco筑基支线航空,创新驱动未来增长
MongoDB 中的 MongoBleed 漏洞正被积极利用
近三年专利大战和解后:三星旗舰手机考虑京东方OLED面板!
哈迪斯入门双流派全解 通关加点技巧分享
美国 ITC 对三星、谷歌等涉 DRAM 公司启动 337 调查
《逃离塔科夫》发布1.0.1.0版本重大更新 新增冬季活动以及缩短匹配时间
宫崎英高称魂类游戏并非创新!只是设计理念满足玩家需求
国产之光!OPPO Find X9 Pro被外媒评为2025年最佳手机
《索尼克赛车:交叉世界》更新上线 梦精灵免费参战
三星为SoC“降温”再出新招 将SoC与内存并排放置
台铃引领骑行新潮流,全场景诠释产品美学
《羊蹄山之魂》女主角笃雕像即将开售 很还原
江东最害怕的一集,《猛将三国》关羽、张辽免费扩展包现已上线
王自如因 246 万元再被限制高消费
qKnow v1.1.0 已经发布,开源知识管理系统
解锁法杖魔法的秘密提升你的冒险技能
MediaTek 2025年度科研成果速报:20篇论文入选ISSCC,布局AI与6G未来
春节出行不焦虑!真我GT8用硬实力守护你的团圆时刻
IDEA 插件 Maven With Me 更新 2.6.x 版本,新增自动同步项目配置助力多 JDK 版本开发!
荣耀Power2跑分曝光:单核1.7k、多核6.5k 暂定下月发
2026年1月发布新机曝光 六大新品乱战看点十足
氮动双色可选!蓝宝石RX9070XT Phontom Link 显卡上市!
小米17 Ultra徕卡2亿长焦拆解:迄今最复杂的长焦结构!
iQOO 15 Ultra春节前登场:首发最强主动散热风扇,性能比肩2nm旗舰
内存疯涨还抢不到货:华硕要进军DRAM内存市场!
超越星巴克?瑞幸的品牌人设立「新」了
不止涨价!内存短缺或致PS6、新Xbox发售重大延期
微信回应“占内存”
搭载双2亿镜头!6.3英寸小屏旗舰工程机满配暴击
内存价格狂飙:多家商店直接暂停PC订单 有钱也买不到
安兔兔发布手机6小时续航测试排名 前三都是一加
国外大神0xZe0n攻破《死亡空间:重制版》D加密
REDMI产品经理:2026年性能机将标配金属中框!
辉达加入科技巨头「不併购式交易」潮 授权Groq晶片技术并延揽高层
当非遗遇上AI:问答、深度研究…看小艺如何用科技赋能非遗传承
任天堂宣布e商店1月重新上架Switch 2 包含国际版
相关栏目:
【
广告资讯37196 】
【
广告推广143353 】
【
广告优化89630 】