快手发布开源多模态大模型 Kwai Keye-VL-1.5
栏目:广告资讯 发布时间:2025-09-11
快手近日正式推出了多模态大语言模型Keye-VL-1.5-8B。https://huggingface.co/Kwai-Keye/Keye-VL-1\_5-8B据悉,相较于前代版本,Keye-VL-1.5在整体性能上实现了显著跃升,尤其在基础视觉理解方面表现亮眼,涵盖视觉元素识别、逻辑推理以及时序信息处理等多个维度。该模型在同参数规模中处于领先水平,部分能力甚至超越了如GPT-4o等闭源模型。Keye-VL-1.5采用了四阶段渐进式训练框架,系统化地提升模型能力。在视觉编码器预训练阶段,模型使用

快手近日正式推出了多模态大语言模型keye-vl-1.5-8b。

https://www./link/5831e536b6f7828e911b47c0f2525161

据悉,相较于前代版本,Keye-VL-1.5在整体性能上实现了显著跃升,尤其在基础视觉理解方面表现亮眼,涵盖视觉元素识别、逻辑推理以及时序信息处理等多个维度。该模型在同参数规模中处于领先水平,部分能力甚至超越了如GPT-4o等闭源模型。

Keye-VL-1.5采用了四阶段渐进式训练框架,系统化地提升模型能力。在视觉编码器预训练阶段,模型使用SigLIP-400M的权重初始化ViT结构,并通过SigLIP对比损失函数对内部数据分布进行持续适配与优化。

第一阶段专注于投影MLP层的优化,确保跨模态特征实现稳定对齐;第二阶段则解冻全部参数,开展端到端的多任务预训练,大幅提升模型的基础视觉理解能力;第三阶段引入退火式微调策略,利用高质样本弥补前期高质量数据覆盖不足的问题,同时将序列长度扩展至128K,调整RoPE逆频率设置,并融入长视频、长文本及大尺寸图像等长上下文内容。

最后,采用同质-异质融合技术,对不同数据混合比例下训练出的模型权重进行加权平均,有效缓解因固定数据配比带来的内在偏差,在保留多样化功能的同时增强模型的鲁棒性与泛化能力。


# 快手  # ai  # gpt  # gpt-4  # 大模型  # https  # 前代  # 多个  # 采用了  # 高质量  # 时将  # 相较  # 第三阶段  # 端到  # 同参数  # 亮眼 


相关文章: 多家磷酸铁锂厂商回应减产检修:上游原材料价格高企致成本压力  首发自研长江SoC!摩尔线程AIBOOK笔记本图赏  男子爱奇艺会员充了 25 年想退费遇难题,官方回应称将核实后安排退费  “AI 教父” 辛顿预测未来就业市场将受影响  微软澄清:没有使用 AI 和 Rust 重写 Windows 系统  字节跳动与南洋理工大学开源 StoryMem 框架  强势升级 全新操控感 赛事级体验 生态矩阵再加码  牛奶盒子设计师:打破常规,让工业设计与用户对话  携手软通|小鱼易连赋能软通动力智慧屏视讯新体验  WIKO X70荣获2025 CNMO年度评选“年度AI先锋”  新年新机首选啥 AMD高端锐龙游戏本推荐  《索尼克赛车:交叉世界》更新上线 梦精灵免费参战  30岁以下亿万富豪创新高!3个月诞生11位年轻创业家 多靠AI白手起家  刘亦菲遇上美团外卖神抢手?两“神”碰撞太精彩!  三星最新款手机推荐:S25之后,三折叠如何终结便携与大屏的取舍?  前豆包 PC 负责人齐俊元加入阶跃星辰,或之后融资创业  抗日游戏《抵抗者》上架Steam 融合谍战解迷和动作射击  京东物流首个海外智狼仓在英国投用,Joybuy 本地最快当日达  吴晓波展示荣耀ROBOT PHONE真机:世界上第一款手机机器人!  跨年家居焕新趋势,安吉尔开启全屋净水升级  等待两年之后,FFmpeg 开发者向瑞芯发出 DMCA 下架通知  iPhone用户建议立即更新!苹果紧急推送WebKit漏洞补丁  OpenAI 人均股票薪酬达 150 万美元  老人2G手机突然没信号 客服回应:2G信号已开始退网 需更换4G手机  锐龙AI MAX+ 395赋能千行百业--之保险理财,Ryypol保险理财顾问智能体解决方案助力打破信息孤岛实现服务体  消息称三星半导体负责人全永铉发布年终内部信,称离赶上内存对手还很远  小米17 Ultra正式开售:徕卡2亿像素镜头 6999元起  内存成本飙升!华硕自1月5日起调涨价格:联想戴尔等大厂早已行动  手机没讯号别再举高高!「重开机」以外的5大必学祕技一览  三星Wide Fold与苹果iPhone Fold渲染图曝光  虫棍太刀双绝!三灯爆发流终极奥义  电竞机也能拍大片!荣耀WIN搭载旗舰拍照算法 罗巍:绝对是同档位最顶  存储价格飙升!2026年PC市场可能萎缩高达9%  资策会携手1111人力银行、联成电脑 打造全方位AI就业人才库  别笑你也过不了第二关! 如龙工作室发布抽象宣传短片  动画《仙剑奇侠传三》终极预告发布,明日腾讯视频开播  游戏玩家最好的圣诞礼物!AMD 锐龙7 9800X3D必选推荐  杨立昆和谷歌 DeepMind CEO 隔空“吵架”,马斯克也站队了  X 上线基于 Grok 模型的“AI 图片编辑”功能  ChatGPT 移动端更新:支持自定义“思考时间”切换功能  2026年苹果六大重磅新品前瞻 含折叠iPhone、轻薄Mac  Switch 2加密技术成最强盾牌!《宝可梦》第十世代洩漏时代恐告终结  《*娘》玩家呼吁加入美国*界 官方似乎正在酝酿中  22岁女天才攻破NVIDIA Tegra X2!特斯拉在内所有设备都能破解:无法修复  三星为SoC“降温”再出新招 将SoC与内存并排放置  鸿蒙版今日头条安装量突破2000万!新增创作中心、碰一碰和隔空传送  内存短缺!DDR4复活:三星计划推迟其停产周期  索尼被苹果抛弃!三星为iPhone 18提供图像传感器  Blender 年度调查:创作者更爱“手活”,仅 7% 用户深度使用 AI  命运多舛 消息称 iPhone Air 2或仍有望在2026年亮相 


相关栏目: 【 广告资讯37196 】 【 广告推广143353 】 【 广告优化89630