hub / github.com/lonePatient/awesome-pretrained-chinese-nlp-models

github.com/lonePatient/awesome-pretrained-chinese-nlp-models @main sqlite

0 symbols 0 edges 1 files 0 documented · 0%

README

Awesome Pretrained Chinese NLP Models

<a href="https://arxiv.org/pdf/2303.18223.pdf">论文: A Survey of Large Language Models</a>

在自然语言处理领域中，预训练语言模型（Pretrained Language Models）已成为非常重要的基础技术，本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬)，并将持续更新......

国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/

系列	代表模型	链接
NLU系列	BERT · RoBERTa · ALBERT · ERNIE · MacBERT · ELECTRA	查看全部 29 个
NLG系列	GPT · GPT-3 · T5 · BART · CPM · RWKV	查看全部 18 个
NLU-NLG系列	UniLM · GLM · CPT · SimBERT	查看全部 9 个
多模态系列	WenLan · CogView · Chinese-CLIP · OFA	查看全部 13 个

📌 备注说明

ND: Non-Causal Decoder (非因果解码器) | CD: Causal Decoder (因果解码器) | ED: Encoder-Decoder (编码器-解码器)

大规模基础模型：表格中只罗列出参数量大于7B以上模型。查看完整列表 →

📋 查看全部 40+ 个模型请访问 Base-LLM 完整列表 →

各个垂直领域开源基础模型。查看完整列表 →

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Qwen-2.5	1.5/7B	2024-09	中英	代码	🤗HF	Qwen2.5	QwenLM	CD	Blog
Qwen-2.5	1.5/7/72B	2024-09	中英	数学	🤗HF	Qwen2.5	QwenLM	CD	Blog
Tongyi-Finance-Base	14B	2023-11	中文	金融	ModelScope	通义金融-14B	通义金融大模型	CD
ChiMed-GPT	13B	2023-10	中文	医疗	[🤗HF]	ChiMed-GPT	中国科学技术大学	CD	Paper
CodeShell-base	7B	2023-10	中英	代码	[🤗HF]	codeshell	WisdomShell	CD

📋 查看全部 13 个模型请访问 Domain-Base-LLM 完整列表 →

具备问答和对话等功能的大型语言模型。查看完整列表 →

📋 查看全部 180+ 个模型请访问 ChatLLM 完整列表 →

各个垂直领域开源对话模型。查看完整列表 →

📋 查看全部 60+ 个模型请访问 Domain-ChatLLM 完整列表 →

收集包含中文的多模态大模型，具备对话等功能。查看完整列表 →

📋 查看全部 90+ 个模型请访问 MultiModal-ChatLLM 完整列表 →

收集推理能力比较突出的中文大模型。查看完整列表 →

📋 查看全部 50+ 个模型请访问 [ReasoningLLM 完整列表 →](docs/reasonin

—

$ claude mcp add awesome-pretrained-chinese-nlp-models \
  -- python -m otcore.mcp_server <graph>