标题 | 分类 | 备注 |
---|---|---|
OCRmyPDF | OCR | 用Tesseract OCR,支持命令行,批量处理 |
MinerU | pdf解析 | 可以解析latex公式,需要至少16GB的GPU |
PDFMathTranslate | pdf翻译工具 | |
zerox | ocr | python的ocr工具 |
Stirling-PDF | 格式转换 | 多种pdf格式转换,私有部署 |
MinerU, pdf解析, latex公式, GPU, 数据处理
MinerU是一个PDF解析工具,支持解析LaTeX公式,适用于需要高性能GPU(至少16GB)的场景。