本文最后更新于 2026年5月4日。
针对 本地CPU快速OCR 和 免费OCR API 两大需求,以下是2026年最新、最实用的推荐方案,全部支持中文、免费/开源、CPU友好。
一、本地CPU快速OCR(离线、隐私、极速)
1. Umi-OCR(Windows 桌面首选,零代码)
- 核心:基于 PaddleOCR / RapidOCR 双引擎,完全免费、开源、离线。
- 速度:
- Rapid 轻量版:CPU单图 < 500ms,适合批量、日常截图。
- Paddle 精准版:中文/复杂版面更强,CPU约1秒。
- 功能:截图OCR、批量图片/PDF、去水印、导出txt/word、可复制不乱码。
- 安装:Windows 一键安装包,开箱即用。
2. RapidOCR(Python 开发/批量首选,极快)
- 定位:纯Python库,无GPU、CPU极致优化,中文OCR速度天花板。
- 速度:i5 CPU单图 200–400ms。
- 精度:接近PaddleOCR,体积小、依赖干净。
- 安装(一行命令):
pip install rapidocr_onnxruntime - 使用(极简代码):
from rapidocr_onnxruntime import RapidOCR ocr = RapidOCR() result, _ = ocr("test.jpg") # result: [[[左上, 右上, 右下, 左下], 文字, 置信度], ...]
3. PaddleOCR(PP-OCRv5 轻量版,高精度CPU)
- 百度开源,PP-OCRv5 超轻量模型(仅70M)。
- 速度:i5 CPU单图 ~500ms。
- 优势:中文、竖排、手写、表格、公式、复杂版面最强。
- 安装:
pip install paddlepaddle pip install paddleocr - 命令行直接用:
paddleocr --image_dir test.jpg --use_gpu=False
4. Tesseract OCR(经典轻量,多语言)
- Google 开源,完全免费、跨平台、支持100+语言。
- 速度:非常快(传统算法,非深度学习)。
- 缺点:中文复杂场景精度一般,适合纯英文/简单印刷体。
- 安装:
- Win: 下载安装包
- Mac:
brew install tesseract - Linux:
apt install tesseract-ocr
5. MinerU(PDF/扫描件 转文字,修复乱码)
- 专门解决 PDF复制乱码:扫描PDF → 文字层PDF / Word。
- 内置OCR,CPU可跑,支持批量、去水印、保留格式。
二、免费OCR API(在线,适合开发/小批量)
1. OCRSpace(免费无限制,最稳)
- 免费额度:完全免费,无次数限制。
- 支持:中英文、多页PDF、URL/上传、返回JSON。
- 限制:单文件最大1MB,适合小图/截图。
- 调用示例(curl):
curl --form "file=@test.jpg" --form "apikey=helloworld" --form "language=chs" https://api.ocr.space/parse/image
2. 百度智能云 OCR(免费额度高)
- 免费:个人认证后 每月500次免费。
- 精度:中文/证件/票据/车牌行业一流。
- 适合:正式项目、高准确率需求。
3. 搜狗/有道 OCR(免费小额度)
- 各平台每日免费额度(通常100–500次)。
- 适合:个人小工具、临时调用。
三、方案对比与选型建议
本地CPU(离线优先)
- 新手/办公/截图:Umi-OCR(一键安装,双引擎)
- Python开发/批量:RapidOCR(最快、最轻量)
- 复杂中文/表格/公式:PaddleOCR v5(精度最高)
- 英文/极简:Tesseract
- PDF乱码修复:MinerU
免费API(在线开发)
- 完全免费无限制:OCRSpace
- 中文高精度/正式项目:百度智能云(免费额度)
四、解决PDF复制乱码的终极本地流程
- 用 MinerU 打开PDF → 执行OCR → 导出可复制PDF/Word。
- 或用 Umi-OCR 打开PDF → 批量识别 → 复制文本。
- 或用 PaddleOCR 命令行:
paddleocr --image_dir test.pdf --use_gpu=False --type='pdf'