通义千问团队今日开源Qwen3-ASR系列语音识别模型,包括Qwen3-ASR-1.7B和Qwen3-ASR-0.6B两个语音识别模型,以及Qwen3-ForcedAligner-0.6B强制对齐模型。该系列模型支持多达52种语言和方言的识别,其中1.7B版本在中文、英文及复杂场景下达到领先水平,0.6B版本则在性能与效率间取得平衡,可实现高速并发处理。强制对齐模型在11种语言的时间戳预测精度上超越传统方案。团队同步开源了模型权重、技术报告及易用的推理框架,旨在推动语音技术的研究与应用。

文章版权声明 1 本网站名称:凉西西小圈
2 本站永久网址:https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
© 版权声明