
<a href="https://arxiv.org/pdf/2303.18223.pdf">论文: A Survey of Large Language Models</a>
在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新......
国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/
| 分类 | 说明 | 链接 |
|---|---|---|
| 通用基础大模型 | 参数 >7B 的基础语言模型 | 查看 |
| 垂直基础大模型 | 金融、医疗、法律等垂直领域 | 查看 |
| 通用对话大模型 | 对话式通用语言模型 | 查看 |
| 垂直对话大模型 | 垂直领域对话模型 | 查看 |
| 多模态对话大模型 | 图文等多模态模型 | 查看 |
| 推理类大模型 | 数学、逻辑推理模型 | 查看 |
| 系列 | 代表模型 | 链接 |
|---|---|---|
| NLU系列 | BERT · RoBERTa · ALBERT · ERNIE · MacBERT · ELECTRA | 查看全部 29 个 |
| NLG系列 | GPT · GPT-3 · T5 · BART · CPM · RWKV | 查看全部 18 个 |
| NLU-NLG系列 | UniLM · GLM · CPT · SimBERT | 查看全部 9 个 |
| 多模态系列 | WenLan · CogView · Chinese-CLIP · OFA | 查看全部 13 个 |
📊 大模型评估基准 · 📦 开源模型库平台 · 📚 开源数据集库 · 📝 中文指令数据集 · 🎯 Embedding · 🔗 Other-Awesome
📌 备注说明
ND: Non-Causal Decoder (非因果解码器) | CD: Causal Decoder (因果解码器) | ED: Encoder-Decoder (编码器-解码器)
大规模基础模型:表格中只罗列出参数量
大于7B以上模型。查看完整列表 →
| 模型 | 大小 | 时间 | 语言 | 架构 | 下载 | 项目 | 机构 | 备注 |
|---|---|---|---|---|---|---|---|---|
| XVERSE-MoE | 255B / A36B | 2024-09 | 中英 | MoE | 🤗HF | GitHub | xverse-ai | - |
| Qwen-2.5 | 0.5\~72B (7档) | 2024-09 | 中英 | CD | 🤗HF | GitHub | QwenLM | Blog |
| Tele-FLM | 52B / 102B / 1TB | 2024-07 | 多语 | CD | 🤗HF | - | CofeAI | Paper |
| meta-llama-3.1 | 8B / 70B / 405B | 2024-07 | 多语 | CD | 🤗HF | GitHub | meta-llama | - |
| internlm2.5-Base | 7B | 2024-07 | 中英 | CD | 🤗HF | GitHub | InternLM | Technical Report |
📋 查看全部 40+ 个模型请访问 Base-LLM 完整列表 →
各个垂直领域开源基础模型。查看完整列表 →
| 模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 | 备注 |
|---|---|---|---|---|---|---|---|---|---|---|
| Qwen-2.5 | 1.5/7B | 2024-09 | 中英 | 代码 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog | |
| Qwen-2.5 | 1.5/7/72B | 2024-09 | 中英 | 数学 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog | |
| Tongyi-Finance-Base | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通义金融-14B | 通义金融大模型 | CD | ||
| ChiMed-GPT | 13B | 2023-10 | 中文 | 医疗 | [🤗HF] | ChiMed-GPT | 中国科学技术大学 | CD | Paper | |
| CodeShell-base | 7B | 2023-10 | 中英 | 代码 | [🤗HF] | codeshell | WisdomShell | CD |
📋 查看全部 13 个模型请访问 Domain-Base-LLM 完整列表 →
具备问答和对话等功能的大型语言模型。查看完整列表 →
| 模型 | 大小 | 时间 | 架构 | 下载 | 项目 |
|---|---|---|---|---|---|
| GLM-4.6 | A32/355B | 2025-10 | MoE | 🤗HF | GLM-4.5 |
| Ling-1T | 1T | 2025-10 | CD | 🤗HF | / |
| Qwen3-Next | A3/80B | 2025-09 | MoE | 🤗HF | Qwen3 |
| Kimi-k2 | A32B/1T | 2025-08 | MoE | HF | Kimi-K2 |
| ERNIE-4.5 | A47/300B A3/21B | 2025-07 | MoE | 🤗HF | / |
| Qwen-3 | 4/14/30/235B | 2025-05 | CD/MoE | 🤗HF | Qwen3 |
| MiMo | 7B | 2025-05 | CD | 🤗HF | MiMo |
| deepseek-v3 | 671B | 2024-12 | MoE | 🤗HF | DeepSeek-V3 |
| Hunyuan-Large | A52/389B | 2024-11 | MoE | 🤗HF | Tencent-Hunyuan-Large |
| Qwen-2.5 | 0.5/1.5/3/7/14/32/72B | 2024-09 | CD | 🤗HF | Qwen2.5 |
| MiniCPM3 | 4B | 2024-09 | CD | 🤗HF | MiniCPM |
📋 查看全部 180+ 个模型请访问 ChatLLM 完整列表 →
各个垂直领域开源对话模型。查看完整列表 →
| 模型 | 大小 | 时间 | 领域 | 下载 | 项目 |
|---|---|---|---|---|---|
| Qwen3-Coder-Next | / | 2026-02 | 代码 | 🤗HF | Qwen3 |
| Skywork-SWE | 32B | 2025-06 | 软件工程 | 🤗HF | / |
| Kimi-Dev | / | 2025-06 | 代码 | 🤗HF | / |
| Qwen3-Coder | / | 2025-08 | 代码 | 🤗HF | Qwen3 |
| DeepSeek-Coder-V2 | A21/236B | 2024-06 | 代码 | 🤗HF | DeepSeek-Coder-V2 |
| CodeGeeX4 | 9B | 2024-07 | 代码 | 🤗HF | CodeGeeX4 |
| Yi-Coder | 1.5/9B | 2024-09 | 代码 | 🤗HF | Yi-Coder |
| OpenCoder | 1.5/8B | 2024-11 | 代码 | 🤗HF | OpenCoder |
📋 查看全部 60+ 个模型请访问 Domain-ChatLLM 完整列表 →
收集包含中文的多模态大模型,具备对话等功能。查看完整列表 →
| 模型 | 大小 | 时间 | 领域 | 下载 | 项目 |
|---|---|---|---|---|---|
| HY-World-2.0 | 1.2B | 2026-04 | 3D世界 | 🤗HF | HY-World-2.0 |
| Gemma-4-IT | E2B~31B | 2026-04 | 通用 | 🤗HF | - |
| Qianfan-OCR | 4B | 2026-03 | 文档 | 🤗HF | GitHub |
| AutoGLM-Phone | 9B | 2025-12 | Agent | 🤗HF | Open-AutoGLM |
| Dolphin-v2 | 3B | 2025-12 | 文图 | 🤗HF | Dolphin |
| DeepSeek-OCR | 3B | 2025-10 | 文图 | 🤗HF | DeepSeek-OCR |
| Qwen-Image | 20B | 2025-08 | 文图 | 🤗HF | Qwen-Image |
| InternVL 2.5 | 2~78B | 2024-12 | 文图 | 🤗HF | InternVL |
| Qwen2-VL | 2/7/72B | 2024-08 | 图文视 | 🤗HF | Qwen2-VL |
| MiniCPM-V 2.6 | 8B | 2024-08 | 文图视 | 🤗HF | MiniCPM-V |
📋 查看全部 90+ 个模型请访问 MultiModal-ChatLLM 完整列表 →
收集推理能力比较突出的中文大模型。查看完整列表 →
| 模型 | 大小 | 时间 | 架构 | 下载 | 项目 |
|---|---|---|---|---|---|
| GLM-5.2 | / | 2026-06 | / | 🤗HF | / |
| Kimi-K2.7-Code | A32/1T | 2026-06 | MoE | 🤗HF | / |
| MiniMax-M3 | A23/428B | 2026-06 | MoE | 🤗HF | / |
| DeepSeek-V4-Pro | A49/1.6T | 2026-04 | MoE | 🤗HF | DeepSeek-V4 |
| MiMo-V2.5-Pro | A42/1.02T | 2026-04 | MoE | 🤗HF | MiMo |
| Kimi-K2.6 | A32/1T | 2026-04 | MoE | 🤗HF | Kimi-K2.6 |
| Qwen3.6 | A3/35B | 2026-04 | MoE | 🤗HF | Qwen3.6 |
| DeepSeek-V3.2 | / | 2025-12 | MoE | 🤗HF | DeepSeek-V3.2-Exp |
| QwQ-32B | 32B | 2025-03 | CD | 🤗HF | / |
| DeepSeek-R1 | A37/671B | 2025-01 | MoE | 🤗HF | DeepSeek-R1 |
| MiniMax-M1 | A46/456B | 2025-06 | MoE | 🤗HF | MiniMax-M1 |
📋 查看全部 50+ 个模型请访问 [ReasoningLLM 完整列表 →](docs/reasonin
—
$ claude mcp add awesome-pretrained-chinese-nlp-models \
-- python -m otcore.mcp_server <graph>