| 标题 | 分类 | 备注 |
|---|---|---|
| BabelDOC | ocr | 论文翻译神器 |
| OpenDoc-0.1B | ocr | 复旦大学视觉与学习实验室开源了超轻量文档解析系统 |
| imagepdf2txt | ocr | 图片型的pdf处理,使用paddle |
| OCRmyPDF | ocr | 用Tesseract OCR,支持命令行,批量处理 |
| MinerU | pdf解析 | 可以解析latex公式,需要至少16GB的GPU |
| PDFMathTranslate | pdf翻译工具 | |
| zerox | ocr | python的ocr工具 |
| Stirling-PDF | 格式转换 | 多种pdf格式转换,私有部署 |
| ParseStudio | pdf导出 | 集成了多种工具 |
| itext-dotnet | net的pdf工具包 |
MinerU, pdf解析, latex公式, GPU, 数据处理
MinerU是一个PDF解析工具,支持解析LaTeX公式,适用于需要高性能GPU(至少16GB)的场景。