【AI 核心摘要】
阶跃今日发布新一代自动语音识别模型StepAudio 2.5 ASR,核心突破在于速度与精度的兼得。该模型率先将大语言模型的推理加速技术引入语音识别领域,基于ASR+MTP-5深度融合架构,实测推理速度提升400%、时延降低60%,推理峰值达500 tokens/s,成本直降80%。精度方面,在多项中英文权威评测基准上超越同类模型,达到SOTA水平。模型复用LLM原生的32K上下文窗口,单次可完整转写长达30分钟的音频,彻底解决传统“切片转写”导致的上下文断裂问题。目前该模型已全量上线阶跃星辰开放平台和Step Plan。
了解更多详细信息,请访问原文:阶跃星辰推出新一代自动语音识别模型StepAudio 2.5 ASR
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

