百度开源端到端长文档 OCR 模型 Unlimited-OCR - 凉西西资源小圈-凉西西资源小圈

【AI 核心摘要】

百度开源了全新的OCR模型Unlimited OCR，在OmniDocBench上刷新SOTA，超越DeepSeek OCR。与传统逐页处理不同，它模仿人类抄录员的工作方式，通过创新的参考滑动窗口注意力（R-SWA）机制，实现连续阅读长文档，显存占用和计算开销几乎不随文档长度增长。实验显示，在OmniDocBench v1.5上综合得分达93.23%，长文档解析稳定，推理速度提升约35%。Unlimited OCR不仅优化了OCR性能，更探索了长上下文任务中的记忆管理新思路，未来计划扩展到语音识别等任务。

了解更多详细信息，请访问原文：百度开源端到端长文档 OCR 模型 Unlimited-OCR

数据来源：AI Bot

文章版权声明 1 本网站名称：凉西西小圈
2 本站永久网址：https://www.xcxybbs.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ418005852进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

文章版权归作者所有，未经允许请勿转载。