MCPcopy
hub / github.com/lonePatient/awesome-pretrained-chinese-nlp-models

github.com/lonePatient/awesome-pretrained-chinese-nlp-models @main sqlite

repository ↗ · DeepWiki ↗
0 symbols 0 edges 1 files 0 documented · 0%
README

Awesome Pretrained Chinese NLP ModelsAwesome

<a href="https://arxiv.org/pdf/2303.18223.pdf">论文: A Survey of Large Language Models</a>

在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新......

国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/

📑 目录导航


📚 模型分类索引

🤖 大模型系列

分类 说明 链接
通用基础大模型 参数 >7B 的基础语言模型 查看
垂直基础大模型 金融、医疗、法律等垂直领域 查看
通用对话大模型 对话式通用语言模型 查看
垂直对话大模型 垂直领域对话模型 查看
多模态对话大模型 图文等多模态模型 查看
推理类大模型 数学、逻辑推理模型 查看

🔧 预训练模型系列

系列 代表模型 链接
NLU系列 BERT · RoBERTa · ALBERT · ERNIE · MacBERT · ELECTRA 查看全部 29 个
NLG系列 GPT · GPT-3 · T5 · BART · CPM · RWKV 查看全部 18 个
NLU-NLG系列 UniLM · GLM · CPT · SimBERT 查看全部 9 个
多模态系列 WenLan · CogView · Chinese-CLIP · OFA 查看全部 13 个

📦 资源与工具

📊 大模型评估基准 · 📦 开源模型库平台 · 📚 开源数据集库 · 📝 中文指令数据集 · 🎯 Embedding · 🔗 Other-Awesome


📌 备注说明

ND: Non-Causal Decoder (非因果解码器) | CD: Causal Decoder (因果解码器) | ED: Encoder-Decoder (编码器-解码器)


Base-LLM

大规模基础模型:表格中只罗列出参数量大于7B以上模型。查看完整列表 →

模型 大小 时间 语言 架构 下载 项目 机构 备注
XVERSE-MoE 255B / A36B 2024-09 中英 MoE 🤗HF GitHub xverse-ai -
Qwen-2.5 0.5\~72B (7档) 2024-09 中英 CD 🤗HF GitHub QwenLM Blog
Tele-FLM 52B / 102B / 1TB 2024-07 多语 CD 🤗HF - CofeAI Paper
meta-llama-3.1 8B / 70B / 405B 2024-07 多语 CD 🤗HF GitHub meta-llama -
internlm2.5-Base 7B 2024-07 中英 CD 🤗HF GitHub InternLM Technical Report

📋 查看全部 40+ 个模型请访问 Base-LLM 完整列表 →

[Back to Top]

Domain-Base-LLM

各个垂直领域开源基础模型。查看完整列表 →

模型 大小 时间 语言 领域 下载 项目地址 机构/个人 架构 文献 备注
Qwen-2.5 1.5/7B 2024-09 中英 代码 🤗HF Qwen2.5 QwenLM CD Blog
Qwen-2.5 1.5/7/72B 2024-09 中英 数学 🤗HF Qwen2.5 QwenLM CD Blog
Tongyi-Finance-Base 14B 2023-11 中文 金融 ModelScope 通义金融-14B 通义金融大模型 CD
ChiMed-GPT 13B 2023-10 中文 医疗 [🤗HF] ChiMed-GPT 中国科学技术大学 CD Paper
CodeShell-base 7B 2023-10 中英 代码 [🤗HF] codeshell WisdomShell CD

📋 查看全部 13 个模型请访问 Domain-Base-LLM 完整列表 →

[Back to Top]

ChatLLM

具备问答和对话等功能的大型语言模型。查看完整列表 →

模型 大小 时间 架构 下载 项目
GLM-4.6 A32/355B 2025-10 MoE 🤗HF GLM-4.5
Ling-1T 1T 2025-10 CD 🤗HF /
Qwen3-Next A3/80B 2025-09 MoE 🤗HF Qwen3
Kimi-k2 A32B/1T 2025-08 MoE HF Kimi-K2
ERNIE-4.5 A47/300B A3/21B 2025-07 MoE 🤗HF /
Qwen-3 4/14/30/235B 2025-05 CD/MoE 🤗HF Qwen3
MiMo 7B 2025-05 CD 🤗HF MiMo
deepseek-v3 671B 2024-12 MoE 🤗HF DeepSeek-V3
Hunyuan-Large A52/389B 2024-11 MoE 🤗HF Tencent-Hunyuan-Large
Qwen-2.5 0.5/1.5/3/7/14/32/72B 2024-09 CD 🤗HF Qwen2.5
MiniCPM3 4B 2024-09 CD 🤗HF MiniCPM

📋 查看全部 180+ 个模型请访问 ChatLLM 完整列表 →

Domain-ChatLLM

各个垂直领域开源对话模型。查看完整列表 →

模型 大小 时间 领域 下载 项目
Qwen3-Coder-Next / 2026-02 代码 🤗HF Qwen3
Skywork-SWE 32B 2025-06 软件工程 🤗HF /
Kimi-Dev / 2025-06 代码 🤗HF /
Qwen3-Coder / 2025-08 代码 🤗HF Qwen3
DeepSeek-Coder-V2 A21/236B 2024-06 代码 🤗HF DeepSeek-Coder-V2
CodeGeeX4 9B 2024-07 代码 🤗HF CodeGeeX4
Yi-Coder 1.5/9B 2024-09 代码 🤗HF Yi-Coder
OpenCoder 1.5/8B 2024-11 代码 🤗HF OpenCoder

📋 查看全部 60+ 个模型请访问 Domain-ChatLLM 完整列表 →

MultiModal-ChatLLM

收集包含中文的多模态大模型,具备对话等功能。查看完整列表 →

模型 大小 时间 领域 下载 项目
HY-World-2.0 1.2B 2026-04 3D世界 🤗HF HY-World-2.0
Gemma-4-IT E2B~31B 2026-04 通用 🤗HF -
Qianfan-OCR 4B 2026-03 文档 🤗HF GitHub
AutoGLM-Phone 9B 2025-12 Agent 🤗HF Open-AutoGLM
Dolphin-v2 3B 2025-12 文图 🤗HF Dolphin
DeepSeek-OCR 3B 2025-10 文图 🤗HF DeepSeek-OCR
Qwen-Image 20B 2025-08 文图 🤗HF Qwen-Image
InternVL 2.5 2~78B 2024-12 文图 🤗HF InternVL
Qwen2-VL 2/7/72B 2024-08 图文视 🤗HF Qwen2-VL
MiniCPM-V 2.6 8B 2024-08 文图视 🤗HF MiniCPM-V

📋 查看全部 90+ 个模型请访问 MultiModal-ChatLLM 完整列表 →

ReasoningLLM

收集推理能力比较突出的中文大模型。查看完整列表 →

模型 大小 时间 架构 下载 项目
GLM-5.2 / 2026-06 / 🤗HF /
Kimi-K2.7-Code A32/1T 2026-06 MoE 🤗HF /
MiniMax-M3 A23/428B 2026-06 MoE 🤗HF /
DeepSeek-V4-Pro A49/1.6T 2026-04 MoE 🤗HF DeepSeek-V4
MiMo-V2.5-Pro A42/1.02T 2026-04 MoE 🤗HF MiMo
Kimi-K2.6 A32/1T 2026-04 MoE 🤗HF Kimi-K2.6
Qwen3.6 A3/35B 2026-04 MoE 🤗HF Qwen3.6
DeepSeek-V3.2 / 2025-12 MoE 🤗HF DeepSeek-V3.2-Exp
QwQ-32B 32B 2025-03 CD 🤗HF /
DeepSeek-R1 A37/671B 2025-01 MoE 🤗HF DeepSeek-R1
MiniMax-M1 A46/456B 2025-06 MoE 🤗HF MiniMax-M1

📋 查看全部 50+ 个模型请访问 [ReasoningLLM 完整列表 →](docs/reasonin

Core symbols most depended-on inside this repo

Shape

For agents

$ claude mcp add awesome-pretrained-chinese-nlp-models \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact