| 标题 | 分类 | 备注 |
|---|---|---|
| OCRmyPDF | OCR | 用Tesseract OCR,支持命令行,批量处理 |
| MinerU | pdf解析 | 可以解析latex公式,需要至少16GB的GPU |
| PDFMathTranslate | pdf翻译工具 | |
| zerox | ocr | python的ocr工具 |
| Stirling-PDF | 格式转换 | 多种pdf格式转换,私有部署 |
| ParseStudio | pdf导出 | 集成了多种工具 |
MinerU, pdf解析, latex公式, GPU, 数据处理
MinerU是一个PDF解析工具,支持解析LaTeX公式,适用于需要高性能GPU(至少16GB)的场景。