【AI 核心摘要】
百度开源了全新的OCR模型Unlimited OCR,在OmniDocBench上刷新SOTA,超越DeepSeek OCR。与传统逐页处理不同,它模仿人类抄录员的工作方式,通过创新的参考滑动窗口注意力(R-SWA)机制,实现连续阅读长文档,显存占用和计算开销几乎不随文档长度增长。实验显示,在OmniDocBench v1.5上综合得分达93.23%,长文档解析稳定,推理速度提升约35%。Unlimited OCR不仅优化了OCR性能,更探索了长上下文任务中的记忆管理新思路,未来计划扩展到语音识别等任务。
了解更多详细信息,请访问原文:百度开源端到端长文档 OCR 模型 Unlimited-OCR
数据来源:AI Bot
© 版权声明
文章版权归作者所有,未经允许请勿转载。

