【AI 核心摘要】
快手发布新一代多模态大模型Keye-VL-2.0-30B-A3B,突破长视频理解瓶颈。该模型首次将DSA(DeepSeek Sparse Attention)机制引入多模态场景,实现256K超长上下文的深度感知,在TimeLens等基准测试中超越Gemini等闭源模型。模型不仅能精准识别画面细节,还能捕捉因果链条,如从冰岛旅行视频中主动建议备手套、识别雪地车祸输出安全策略。同时,Keye-VL首次解锁Agent协作机制,在Code、Tool等场景展现系统级执行潜力。通过Context-RL奖励机制和严苛数据引擎,模型在数学推理、指令遵循等通用能力上全面爆发。快手强调,该模型已落地生成式推荐、内容治理等核心业务,驱动真实商业收益。
了解更多详细信息,请访问原文:快手开源自研多模态大模型 Keye-VL-2.0-30B-A3B
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

