MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,能通过自然语言指令自动完成跨应用、多步骤的复杂手机操作。它具备三大核心能力:在用户指令模糊时主动提问澄清意图;优先调用结构化工具(如地图API)替代繁琐的界面点击,提升效率与成功率;通过端云协同架构,让轻量模型处理日常任务与隐私操作,复杂任务由云端大模型接力,兼顾性能与数据安全。模型在多项权威评测中领先,尤其在需要长程规划、跨应用协作的真实场景基准上表现出色。目前2B与8B模型已开源。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

