yuanlab.ai 团队正式对外开源 源 yuan3.0 flash 多模态基础大模型。本次发布涵盖完整模型权重(支持16bit与4bit量化版本)、详尽技术白皮书、全流程训练方案及全面评测数据,全面开放社区进行后续微调、二次训练与垂直领域定制化开发。
据官方说明,Yuan3.0 Flash 是一款参数量达40B的多模态基础大模型,基于稀疏混合专家(MoE)架构设计,单次前向推理仅动态激活约3.7B参数。该模型首次提出并落地强化学习优化范式 RAPO(Reflection-Aware Policy Optimization),并创新引入反思抑制奖励机制(RIRM),从训练源头约束模型减少冗余反思行为,在保障甚至提升逻辑推理准确率的同时,显著削减推理阶段的 token 生成量,从而大幅压缩计算资源消耗,在“低算力开销、高智能水平”的大模型演进方向上实现关键突破。
Yuan3.0 Flash 整体由三大部分构成:高性能视觉编码器、高效语言主干网络,以及鲁棒的多模态对齐模块。其中,语言主干采用局部过滤增强型注意力机制(LFA)与MoE结构协同设计,在提升注意力建模精度的基础上,有效缓解训练与推理过程中的显存压力与算力负担。
在多模态融合方面,模型通过视觉编码器将图像信息编码为统一语义token,与文本token共同输入语言主干,并借助多模态对齐模块完成跨模态特征的精准、稳定映射。此外,系统集成自适应图像分块策略,既可支撑超高分辨率图像理解任务,又可显著降低GPU显存占用与整体计算开销。
公告指出,在面向企业级落地的关键任务中——包括RAG增强对话(ChatRAG)、多模态文档检索(Docmatix)、多模态表格解析(MMTab)以及智能摘要生成(SummEval)——Yuan3.0 Flash 的综合性能已超越 GPT-5.1,展现出更强的产业适配性与实用价值。
在权威多模态推理与纯语言理解评测中,Yuan3.0 Flash(40B)的精度表现逼近 Qwen3-VL235B-A22B(235B)与 DeepSeek-R1-0528(671B)等超大规模模型,但其平均 token 消耗仅为上述模型的 1/4 至 1/2,为企业部署轻量高效的大模型解决方案提供了全新选择。
源 Yuan 3.0 系列基础模型将按能力与规模划分为
Flash、Pro 和 Ultra 三大版本,对应参数量分别为 40B、200B 与 1T,满足不同场景下的性能与成本需求。
源码获取地址:点击下载
# Reflection
# 高性能
# 既可
# 更强
# 点击下载
# 分别为
# 仅为
# 基础上
# 显存
# 三大
# 多模
# 编码
# Token
# 架构
# qwen
# deepseek
# ultra
# 大模型
# gpt-5
# gpt
# ai
相关文章:
三星最新款手机推荐:GalaxyZ TriFold以三折智慧定义高端移动体验
内存价格坐上火箭!DDR4一年暴涨1800%:2026年还要涨
小红书又在搞事情
广电总局:2026 起整治 AI 魔改四大名著等内容
5倍溢价!Faker成都见面会门票被黄牛超至上万元
OpenAI “烧钱”经营模式将成为 2026 年 AI 投资泡沫讨论的核心问题
《怪物猎人:荒野》数据挖掘惊现Switch2标识
惊见联发科蔡力行兼职炸薯条?麦当劳进驻联发科技新竹总部
风刃连招实战攻略:撕裂战场的关键技巧
OpenAI 为 ChatGPT 推出“格式化块”功能
太大胆了! 俄罗斯模特cos《巫师3》凯拉·梅兹
内存涨价成暴利产业 传三星祭出霸王条款:想拿货就得听他的
小米17 Ultra正式发布 搭载徕卡APO光学认证2亿像素镜头
艾达都51了!网友统计2025年《生化危机》各角色年龄
消息称美国批准三星、SK 海力士向中国工厂出口芯片制造设备
手游电竞还是得看天玑旗舰 这四款游戏手机值得买
OpenAI 正在内部测试 ChatGPT “Skills” 功能
软银完成对 OpenAI 的 225 亿美元追加投资
中国广电完成5G-A低空通信专网关键技术验证 上行速率实测超200Mbps
众泰汽车董事长李立忠因个人家庭原因辞职,仅上任两个月
LLVM 考虑制定 AI 工具策略
传vivo X300 Ultra将在三月发布:2亿像素+35mm主摄
新一代影像旗舰!vivo X300 Ultra规格曝光
台积电 2 纳米 (N2) 技术已如期于 2025 年第四季开始量产
最后的中高端LCD手机?机身重255g 电池5000mAh
稳步迭代,全面超越:vivo S50 Pro mini 评测:小直屏旗舰的进化标杆
不止涨价!内存短缺或致PS6、新Xbox发售重大延期
京东物流无人机已进入全国常态化测试运营阶段,开通近 50 条航线
轻松驯服陆行鸟新手友好攻略
神秘小屏手机遭曝光 双2亿像素镜头 猜猜是谁家的?
《荒野大镖客2》七年后仍引热议:玩家挑战“蜘蛛梦之谜”
《女神异闻录:夜幕魅影》地铁肘击王海外爆火!制作人感到困惑惊讶
首次引入中国面板商 华星光电为三星A57供应OLED屏幕
DjangoAdmin 敏捷开发框架 Django+EleVue 版本 v2.7.0 发布
网友神评小米17 Ultra:拍照特别毒 很有味
跳票小萝莉"扭秧歌" 《识质存在》戴安娜新动作展示
vivo X300 Ultra 获欧洲 EEC 认证、最快明年 4 月现身!或为系列首款海外销售机型、香港都有可能出?
新年新机首选啥?AMD高端锐龙游戏本推荐
人物塑造是关键!新研究展示玩家们如何看待游戏中的女角色
京东航空开通“深圳 = 十堰”航线,鄂西北全货机货运实现“从无到有”
Midscene v1.0 发布 - 视觉驱动,UI 自动化体验跃迁
影像机皇?周意保称OPPO Find X9 Ultra各焦段均升级
耐用折叠屏手机推荐:三星GalaxyZ TriFold何以重塑旗舰耐用性标杆?
Firefox 即将推出标签页“视图拆分”功能
CES2026华擎引领创新风潮,全面扩展PC产品线并发表首款一体式水冷散热器
Fish Shell 4.3 正式发布 — 更强脚本支持与交互体验提升
艾什莉脸模cos罗莎塔公主参加c107 网友称:美到失语
刘思慕确定《热血无赖》真人电影版导演 项目继续推进
小米17 Ultra发布会定档12月25日,与徕卡合作引领影像创新
韩国创作物协会新报告:2025年下半年搜打撤游戏热潮
相关栏目:
【
广告资讯37196 】
【
广告推广143353 】
【
广告优化89630 】