MinerU

上海 AI 实验室 OpenDataLab 出品，开源文档解析事实标准。

一句话定义

诞生于 InternLM 大模型预训练数据处理过程的开源 OCR / 文档解析工具，2026 用扩散解码重新定义 OCR 范式。

版本	类型	关键能力
MinerU 3.0	Pipeline	全格式（PDF/图片/DOCX）、109 种语言、自动去页眉页脚、表格公式提取、OmniDocBench v1.5 得分 86.2
MinerU2.5	VLM	长期作为 OCR 模型 benchmark 基准
MinerU-Diffusion-V1	扩散解码（2026-03-24 发布）	2.5B 参数，4 任务，吞吐 3.26×

HuggingFace Transformers / Nano-DVLM（单 GPU）/ SGLang（高性能服务化）

opendatalab/MinerU-Diffusion-V1-0320-2.5B