MCPcopy
hub / github.com/Hoper-J/AI-Guide-and-Demos-zh_CN

github.com/Hoper-J/AI-Guide-and-Demos-zh_CN @main sqlite

repository ↗ · DeepWiki ↗
79 symbols 278 edges 10 files 57 documented · 72%
README

这是一个中文的 AI/LLM 大模型入门项目

回顾过去的学习历程,吴恩达和李宏毅老师的视频为我的深度学习之路提供了极大的帮助。他们幽默风趣的讲解方式和简单直观的阐述,让枯燥的理论学习变得生动有趣。

然而,在实践的时候,许多学弟学妹们最初会烦恼于怎么去获取国外大模型的 API ,尽管最终都能找到解决方法,但第一次的畏难情绪总是会拖延学习进度,逐渐转变为“看视频就够了”的状态。我时常在评论区看到类似的讨论,于是决定利用闲暇时间帮学子们跨过这道门槛,这也是项目的初衷。

本项目不会提供🪜科学上网的教程,也不会依赖平台自定义的接口,而是使用更兼容的 OpenAI SDK,帮助大家学习更通用的知识。

项目将从简单的 API 调用入手,带你逐步深入大模型的世界。在此过程中,你将掌握 AI 视频摘要LLM 微调AI 图像生成等技能。

强烈建议观看李宏毅老师的课程「生成式人工智能导论」同步学习:课程相关链接快速访问

现在,项目还开设了🎡CodePlayground,你可以按照文档配置好环境,使用一行代码运行脚本,体验 AI 的魅力。

📑论文随笔位于 PaperNotes,将逐步上传大模型相关的基础论文。

🚀 基础镜像已经准备好,如果你还没有配置好属于自己的深度学习环境,不妨尝试一下 Docker。

祝你旅途愉快!

目录

  • Tag 说明:
  • ---: 基础知识,根据需要进行观看,也可以暂时跳过。其中的代码文件结果都会在文章中示出,但仍建议动手运行代码。可能会有显存要求。
  • API: 文章仅使用大模型的 API,不受设备限制,无 GPU 也可运行。
    • Kaggle 目前不允许使用 Gradio,故部分交互文件不提供相关链接(这一类文件可以本地运行)。
  • LLM: 大型语言模型相关的实践,代码文件可能有显存要求。
  • SD: Stable Diffusion,文生图相关的实践,代码文件有显存要求。
  • Online 在线链接说明
  • 与 Code 内容一致,如果提供了 Kaggle 和 Colab,则三选一运行。
  • 如果仅提供了 Colab,说明不受显卡限制可以本地运行,此时不能科学上网的同学可以下载 File 的代码,学习效果一致。
  • 运行时请不要忘记打开对应在线平台的 GPU。
    • Kaggle:Setting -> Accelerator -> 选择 GPU
    • Colab:代码执行程序 -> 更改运行时类型 -> 选择 GPU

✨ New

好久不见,更新一篇 MCP 相关的中间文章,或许会对你有所帮助。

因为还没想好模块标题,所以暂时置顶。

目前项目将在叙述上全面使用 uv 进行环境的配置,这是一次并不“友好”的改动,但考虑到其目前已经被广泛应用,「长痛不如短痛」,索性从本项目开始“折腾”,希望能让你熟悉 uv 的使用。

Colab 链接因为原账户没绑定恢复邮箱,被暂停了外部访问且无法恢复(引以为戒),后续我会抽空迁移至新账户上。

DeepSeek 使用手册

这部分内容将直接由之前的文章(导论部分)重组得来,故存在重复,此模块将暂时专注于 DeepSeek API 的使用,是 OpenAI SDK 相关的通用知识,也可以作为导论 API 部分的拓展。

DeepSeek API【共享】

Guide Tag Describe File Online
DeepSeek API 的获取与对话示例 API 获取 DeepSeek API 的 N 种方法及其单轮对话样例:
  • DeepSeek 官方

  • 硅基流动

  • 阿里云百炼

  • 百度智能云

  • 字节火山引擎 | Code | Kaggle

Colab | | DeepSeek 联网满血版使用指南 | API | 通过 API 绕开 DeepSeek 网页对话的卡顿,提供两种配置方案:

  • Cherry Studio【推荐】

  • Chatbox | | | | DeepSeek API 输出解析 - OpenAI SDK | API | 关于 OpenAI SDK 的通用知识,以 DeepSeek 聊天/推理模型为例进行演示:

  • 认识 API 的返回字段

  • 打印模型回复和每次对话的用量信息

| Code | Kaggle

Colab | | └─流式输出解析 | API | API 解析 - 流式输出篇

  • 认识 chunk 的结构

  • 处理各平台聊天/推理模型的流式输出 | Code | Kaggle

Colab | | DeepSeek API 多轮对话 - OpenAI SDK | API | DeepSeek API 的多轮对话示例 - 非流式输出篇:

  • 认识单轮对话和多轮对话时 messages 的差异

  • 尝试封装对话类 | Code | Kaggle

Colab | | └─统一模型对话逻辑与流式输出 | API | - 统一聊天模型和推理模型对话类

  • 引入流式输出处理

【代码文件】

  • 使用 APIConfigManager 进行各平台配置,不再分散逻辑 | Code | Kaggle

Colab |


导论

Guide Tag Describe File Online
00. 大模型 API 获取步骤 API 带你一步步的获取 API:

Colab | | 02. 简单入门:通过 API 与 Gradio 构建 AI 应用 | API | 指导如何去使用 Gradio 搭建一个简单的 AI 应用。 | Code | Colab | | 03. 进阶指南:自定义 Prompt 提升大模型解题能力 | API | 你将学习自定义一个 Prompt 来提升大模型解数学题的能力,其中一样会提供 Gradio 和非 Gradio 两个版本,并展示代码细节。 | Code | Kaggle

Colab | | 04. 认识 LoRA:从线性层到注意力机制 | --- | 在正式进入实践之前,你需要知道 LoRA 的基础概念,这篇文章会带你从线性层的 LoRA 实现到注意力机制。 | | | | 05. 理解 Hugging Face 的 AutoModel 系列:不同任务的自动模型加载类 | --- | 我们即将用到的模块是 Hugging Face 中的 AutoModel,这篇文章一样是一个前置知识,你将了解到如何查看模型的参数和配置信息,以及如何使用 inspect 库进一步查看对应的源码。 | Code | Kaggle

Colab | | 06. 开始实践:部署你的第一个语言模型 | LLM | 实现非常入门的语言模型部署,项目到现在为止都不会有 GPU 的硬性要求,你可以继续学习。 | Code

app_fastapi.py

app_flask.py | | | 07. 探究模型参数与显存的关系以及不同精度造成的影响 | --- | 了解模型参数和显存的对应关系并掌握不同精度的导入方式会使得你对模型的选择更加称手。 | | | | 08. 尝试微调 LLM:让它会写唐诗 | LLM | 这篇文章与 03. 进阶指南:自定义 Prompt 提升大模型解题能力一样,本质上是专注于“用”而非“写”,你可以像之前一样,对整体的流程有了一个了解,尝试调整超参数部分来查看对微调的影响。 | Code | Kaggle

Colab | | 09. 深入理解 Beam Search:原理, 示例与代码实现 | --- | 从示例到代码演示,讲解 Beam Search 的数学原理,这应该能解决一些之前阅读的困惑,最终提供一个简单的使用 Hugging Face Transformers 库的示例(如果跳过了之前的文章的话可以尝试它)。 | Code | Kaggle

Colab | | 10. Top-K vs Top-P:生成式模型中的采样策略与 Temperature 的影响 | --- | 进一步向你展示其他的生成策略。 | Code | Kaggle

Colab | | 11. DPO 微调示例:根据人类偏好优化 LLM 大语言模型 | LLM | 一个使用 DPO 微调的示例。 | Code | Kaggle

Colab | | 12. Inseq 特征归因:可视化解释 LLM 的输出 | LLM | 翻译和文本生成(填空)任务的可视化示例。 | Code | Kaggle

Colab | | 13. 了解人工智能可能存在的偏见 | LLM | 不需要理解代码,可以当作休闲时的一次有趣探索。 | Code | Kaggle

Colab | | 14. PEFT:在大模型中快速应用 LoRA | --- | 学习如何在导入模型后增加 LoRA 层。 | Code | Kaggle

Colab | | 15. 用 API 实现 AI 视频摘要:动手制作属于你的 AI 视频助手 | API & LLM | 你将了解到常见的 AI 视频总结小助手背后的原理,并动手实现 AI 视频摘要。 | Code - 完整版

Code - 精简版

🎡脚本 | Kaggle

Colab | | 16. 用 LoRA 微调 Stable Diffusion:拆开炼丹炉,动手实现你的第一次 AI 绘画 | SD | 使用 LoRA 进行文生图模型的微调,现在你也能够为别人提供属于你的 LoRA 文件。 | Code

Code - 精简版

🎡 脚本 | Kaggle

Colab-a

Colab-b | | 17. 浅谈 RTN 模型量化:非对称 vs 对称.md | --- | 更进一步地了解 RTN 模型量化的行为,文章以 INT8 为例进行讲解。 | Code | Kaggle

Colab | | 18. 模型量化技术概述及 GGUF & GGML 文件格式解析 | --- | 这是一个概述文章,或许可以解决一些你在使用 GGUF/GGML 时的疑惑。 | | | | 19a. 从加载到对话:使用 Transformers 本地运行量化 LLM 大模型(GPTQ & AWQ)

19b. 从加载到对话:使用 Llama-cpp-python 本地运行量化 LLM 大模型(GGUF) | LLM | 你将在自己的电脑上部署一个拥有 70 亿(7B)参数的量化模型,注意,这篇文章没有显卡要求。

19 a 使用 Transformers,涉及 GPTQ 和 AWQ 格式的模型加载。

19 b 使用 Llama-cpp-python,涉及 GGUF 格式的模型加载。

另外,你还将完成本地的大模型对话交互功能。 | Code - a

Code - b

🎡脚本 | Kaggle - a

Colab - a

Kaggle - b

Colab - b | | 20. RAG 入门实践:从文档拆分到向量数据库与问答构建 | LLM | RAG 的相关实践。

了解文本分块的递归工作原理。 | Code | Kaggle

[Colab](https://colab.researc

Core symbols most depended-on inside this repo

check_installation
called by 5
CodePlayground/utils/environment_manager.py
load_config
called by 5
CodePlayground/utils/config_manager.py
debug_func_metadata
called by 4
Demos/mcp/debug_func_metadata.py
add_message
called by 4
CodePlayground/chat.py
read_subtitle
called by 3
CodePlayground/summarizer.py
print_json
called by 2
Demos/mcp/debug_func_metadata.py
format_timestamp
called by 2
CodePlayground/summarizer.py
_append_user_message
called by 2
CodePlayground/chat.py

Shape

Function 39
Method 29
Class 9
Route 2

Languages

Python100%

Modules by API surface

CodePlayground/chat.py19 symbols
CodePlayground/sd_lora.py12 symbols
Demos/mcp/debug_message_validator.py11 symbols
CodePlayground/utils/environment_manager.py11 symbols
CodePlayground/summarizer.py8 symbols
Demos/mcp/debug_func_metadata.py6 symbols
Demos/mcp/server.py4 symbols
Demos/app_fastapi.py3 symbols
CodePlayground/utils/config_manager.py3 symbols
Demos/app_flask.py2 symbols

Dependencies from manifests, versioned

accelerate1.9.0 · 1×
bitsandbytes0.46.1 · 1×
colorama0.4.6 · 1×

For agents

$ claude mcp add AI-Guide-and-Demos-zh_CN \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact