立即将 PDF 页面转换为高质量图片。
来自 AI 和 OCR 领域的最新消息和动态。
DeepSeek 发布了搭载 DeepEncoder V2 架构的 OCR 2,提供类似人类的视觉逻辑,并将 Token 效率提升了 20 倍。
百度发布开源文档解析模型 Unlimited-OCR,利用参考滑动窗口注意力(R-SWA)实现单次前向传播解析数十页文档,且显存占用恒定。