
🚀MinerU 官网入口→✅ 免装在线版 ✅ 全功能客户端 ✅ 开发者API在线调用,省去部署麻烦,多种产品形态一键get,速冲!
👋 join us on <a href="https://discord.gg/Tdedn9GTXq" target="_blank">Discord</a> and <a href="https://mineru.net/community-portal/?aliasId=3c430f94" target="_blank">WeChat</a>
MinerU — 专为 LLM · RAG · Agent 场景构建的高精度文档解析引擎
将 PDF · DOCX · PPTX · XLSX · 图片 · 网页转为结构化 Markdown / JSON · VLM+OCR 双引擎 · 109 种语言
MCP Server · LangChain / Dify / FastGPT 原生集成 · 10+ 国产算力适配
🔍 核心解析能力
- 原生支持 DOCX、PPTX、XLSX 解析
- 公式 → LaTeX · 表格 → HTML,精准还原复杂版面
- 支持扫描件、手写体、多栏布局、跨页表格合并
- 输出符合人类阅读顺序,自动去除页眉页脚
- VLM + OCR 双引擎,支持 109 种语言识别
🔌 接入方式
| 场景 | 方案 |
|---|---|
| AI 编程工具 | MCP Server — Cursor · Claude Desktop · Windsurf |
| RAG 框架 | LangChain · LlamaIndex · RAGFlow · RAG-Anything · Flowise · Dify · FastGPT |
| 开发集成 | Python / Go / TypeScript SDK · CLI · REST API · Docker |
| 零代码 | mineru.net 在线版 · Gradio WebUI · 桌面客户端 |
🖥️ 部署生态(支持私有化 · 完全离线)
| 推理后端 | 适用场景 |
|---|---|
| pipeline | 快速稳定,无幻觉,CPU / GPU 均可运行 |
| vlm-engine | 高精度,支持 vLLM / LMdeploy / mlx 生态 |
| hybrid-engine | 高精度,原生文本提取,低幻觉 |
国产算力:昇腾 · 寒武纪 · 燧原 · 沐曦 · 摩尔线程 · 昆仑芯 · 天数智芯 · 瀚博 · 太初元碁 · 海光 · 平头哥
本次版本更新聚焦于 pipeline 后端 OCR 能力升级、OCR 处理链路优化 与 模型下载体验改进。主要更新内容包括:
OCR 模型升级与处理加速
pipeline 后端 OCR 模型更新至 PP-OCRv6,在 OmniDocBench v1.6 评测中,OCR 相关指标提升约 11%。ch OCR 模型,简化模型配置与语言选择逻辑。100%,显著改善批量文档和 OCR 密集型文档的解析效率。模型下载逻辑优化
在 3.4 版本,MinerU 进一步提升了 pipeline 后端在 OCR 场景下的解析精度与处理效率,同时优化了模型下载、缓存复用和本地配置写入流程,让首次安装、模型更新和多环境部署更加稳定、自动化。
本次版本更新聚焦于 Hybrid 解析性能优化 与 VLM 模型能力升级。主要更新内容包括:
Hybrid 后端新增 effort 解析强度参数
medium 与 high 两档解析强度,用户可根据解析速度、解析精度和功能需求灵活选择。medium 相比 high 综合精度仅降低 0.13,但在不同设备和场景下可获得 35% ~ 220% 的解析速度提升:80%,OCR 场景提升约 35%90%,OCR 场景提升约 45%220%,OCR 场景提升约 50%effort=medium,在保持高解析精度的同时显著提升整体解析效率。medium 档不支持 image analysis(图片/图表分析)功能;如需极致解析精度或启用 image analysis,可通过 effort=high 切换至高强度解析模式,但解析速度会受到一定影响。VLM 模型升级至 MinerU2.5-Pro-2605-1.2B
2604 版本中存在的多处模型问题,进一步提升复杂文档场景下的解析稳定性。通过 3.3 版本,MinerU 在保持高精度解析能力的同时,进一步提升了 Hybrid 后端在多平台、多场景下的解析效率。默认 medium 解析强度更适合大多数日常文档处理任务,而 high 模式则面向对解析精度和 image analysis 能力有更高要求的场景。
本次版本更新聚焦于许可协议开放性、解析精度提升与全格式原生支持。主要更新内容包括:
AGPLv3 切换至基于 Apache 2.0 的 MinerU 开源许可证。MinerU2.5-Pro-2604-1.2B,整体解析精度提升至业内领先水平。PPTX 与 XLSX 原生解析能力。PDF、DOCX、PPTX、XLSX 全格式解析,为多类型文档统一处理提供了更完整的能力闭环。通过 3.1.0 版本,MinerU 在开放性、解析精度和落地能力上进一步提升。新的许可协议降低了社区使用和商业接入门槛,MinerU2.5-Pro-2604-1.2B 提升了复杂内容的解析质量,而 PPTX 与 XLSX 原生解析的补齐,也让 MinerU 完成了主流文档格式的端到端覆盖。
本次版本更新围绕解析能力、系统架构与工程可用性进行了系统升级。主要更新内容包括:
DOCX 原生解析DOCX 原生解析,在无幻觉前提下实现高精度解析。DOCX 转为 PDF 再解析”的传统流程,端到端速度提升数十倍以上,更适合对精度与吞吐均有要求的场景。pipeline 后端升级pipeline 后端在 OmniDocBench (v1.5) 上取得 86.2 分,精度超过上一代主流 VLM MinerU2.0-2505-0.9B。API / CLI / Router 编排升级mineru 现作为基于 mineru-api 的编排客户端运行;在未传入 --api-url 时,会自动拉起本地临时服务。mineru-api 新增异步任务接口 POST /tasks,支持任务提交、状态查询与结果获取;同时保留同步解析接口 POST /file_parse,以兼容老版本插件。mineru-router,适用于多服务、多 GPU 的统一入口部署与任务路由;其接口与 mineru-api 完全兼容,并支持任务自动负载均衡。torch >= 2.8 的兼容问题,基础镜像升级为 vllm0.11.2 + torch2.9.0,统一了不同 Compute Capability 的安装路径。pipeline 的 batch 推理支持流式落盘,已完成的解析结果可及时写出,进一步提升长任务处理体验。mineru-router,可一键实现多卡部署,轻松构建高并发、高吞吐解析系统。doclayoutyolo 和 mfd_yolov8)以及一个 CC-BY-NC-SA 4.0 模型(layoutreader)的使用。 本次更新不仅是若干功能点的补强,更是 MinerU 在系统能力上的一次关键跃迁。我们重点解决了长文档解析过程中的内存峰值占用问题,通过滑动窗口、流式落盘等链路优化,让超长文档解析从“需要手动拆分、谨慎处理”走向“稳定可跑、规模可扩展”。同时,我们完成了线程安全优化,全面支持多线程并发推理,进一步提升了单机资源利用率与高并发场景下的运行稳定性。在此基础上,基于 mineru-router 与全新的 API / CLI 编排体系,MinerU 已具备一键多卡部署、多服务统一接入、任务自动负载均衡的能力,显著降低了大规模部署难度。至此,MinerU 正在从单一的数据生产工具,进一步演进为面向高并发、高吞吐场景的大规模文档解析基座,为企业级文档数据处理提供更稳定、更高效、更易扩展的基础设施能力。
📝 查看完整的 更新日志 了解更多历史版本信息
MinerU 是一款文档解析工具,可将 PDF、图片以及 DOCX、PPTX、XLSX 转化为机器可读格式(如 Markdown、JSON),便于后续检索、抽取与二次处理。
MinerU诞生于书生-浦语的预训练
$ claude mcp add MinerU \
-- python -m otcore.mcp_server <graph>