【AI 核心摘要】
智谱AI推出GLM-5.1高速版API,输出速度达400 tokens/s,刷新全球大模型API速度上限。该模型首次在国产大模型中实现旗舰级能力与极致低延迟的结合,打破“快即小”的行业惯例。在长程任务中,30秒内完成复杂网页处理;在Agent Swarm中,瞬间调度50个人格并行回答。实测显示,写代码速度提升10倍,3D场景实时建模,并具备新型操作系统雏形。速度优化源于TileRT高性能推理引擎,通过编译期静态编排、Tile级微任务调度和多卡协同,实现稳定可用的生产级能力。该API适用于AI编程、实时交互、商业决策等场景,已面向部分企业客户开放。
了解更多详细信息,请访问原文:智谱推出GLM-5.1高速版API,GLM-5.1-highspeed
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

