【AI 核心摘要】
阿里Fun-ASR1.5作为新一代端到端语音识别大模型,显著提升了语音识别的实用性和准确性。该模型支持30种语言的无缝切换,并能精准处理跨语言混合对话场景。针对中文,它覆盖七大方言体系及二十余种地方口音,平均字错误率较上一版本下降56.2%,还能原汁原味还原方言词汇。此外,模型新增对古诗词诵读的专项识别能力,字符准确率达97%。在输出环节,Fun-ASR1.5能智能预测标点并自动规范转换数字、日期等表达,大幅降低人工校对成本,推动语音转写从“能用”走向“好用”。
了解更多详细信息,请访问原文:阿里通义推出端到端语音识别大模型Fun-ASR1.5
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

