商汤今日开源多模态自主推理模型SenseNova-MARS(8B/32B双版本)。该模型在多模态搜索与推理核心基准测试中以69.74分超越Gemini-3-Pro与GPT-5.2,成为首个支持动态视觉推理和图文搜索深度融合的Agentic VLM模型。它能够自主规划步骤、调用工具,在MMSearch、HR-MMSearch等多项评测中取得开源模型SOTA成绩,并在搜索推理和视觉理解领域全面领先闭源模型。SenseNova-MARS可处理需“细节识别+信息检索+逻辑推理”的复杂任务,适用于行业分析、赛事解读等真实场景。模型、代码及数据集已全面开源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

