智谱AI发布GLM-5V-Turbo多模态编程基座模型,原生融合视觉与文本能力,支持处理图片、视频、设计稿等多模态输入,并能根据视觉信息生成可运行代码。该模型具备200K上下文窗口,在视觉编程、GUI Agent等基准测试中表现领先,同时确保纯文本编程能力不退化。通过与Claude Code等框架深度协同,模型实现了从环境感知到任务执行的完整闭环,并已获得字节跳动、美团等企业的积极评价。GLM-5V-Turbo现已开放体验,支持通过AutoClaw、Z.ai等平台接入。
© 版权声明
文章版权归作者所有,未经允许请勿转载。

