立即將 PDF 頁面轉換為高品質圖片。
來自 AI 和 OCR 領域的最新消息和動態。
DeepSeek 發布了搭載 DeepEncoder V2 架構的 OCR 2,提供類似人類的視覺邏輯,並將 Token 效率提升了 20 倍。
百度發布開源文檔解析模型 Unlimited-OCR,利用參考滑動窗口注意力(R-SWA)實現單次前向傳播解析數十頁文檔,且顯存佔用恆定。