【AI 核心摘要】

美团正式开源LongCat-Video-Avatar 1.5,这是一款从SOTA迈向商业级应用的数字人视频模型。该版本在唇形同步、物理合理性、长视频稳定性、多人互动和高效推理上实现全面升级,能稳定输出高质量内容。核心改进包括:采用Whisper-large编码器提升唇形同步与全身稳定性;构建多阶段数据处理流程,增强多人、静默和情绪场景适应能力;引入GRPO进行人类偏好对齐,优化手部稳定性和动作连续性;采用DMD蒸馏技术实现约15倍推理效率提升,生成10秒视频仅需1分钟。评测显示,该模型在自然度、真实感和稳定性上优于部分头部闭源模型,在单人场景得分3.336,多人场景得分2.730,主体变形问题率仅23.1%,跳帧问题率仅0.8%。开源旨在为开发者和创作者提供可验证、可改进的技术基座。


了解更多详细信息,请访问原文:美团开源数字人视频模型 LongCat-Video-Avatar 1.5

数据来源:AI Bot

文章版权声明 1 本网站名称:凉西西小圈
2 本站永久网址:https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
6 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
© 版权声明