hub / github.com/Hoper-J/AI-Guide-and-Demos-zh_CN

github.com/Hoper-J/AI-Guide-and-Demos-zh_CN @main sqlite

79 symbols 278 edges 10 files 57 documented · 72%

README

这是一个中文的 AI/LLM 大模型入门项目

回顾过去的学习历程，吴恩达和李宏毅老师的视频为我的深度学习之路提供了极大的帮助。他们幽默风趣的讲解方式和简单直观的阐述，让枯燥的理论学习变得生动有趣。

然而，在实践的时候，许多学弟学妹们最初会烦恼于怎么去获取国外大模型的 API ，尽管最终都能找到解决方法，但第一次的畏难情绪总是会拖延学习进度，逐渐转变为“看视频就够了”的状态。我时常在评论区看到类似的讨论，于是决定利用闲暇时间帮学子们跨过这道门槛，这也是项目的初衷。

本项目不会提供🪜科学上网的教程，也不会依赖平台自定义的接口，而是使用更兼容的 OpenAI SDK，帮助大家学习更通用的知识。

项目将从简单的 API 调用入手，带你逐步深入大模型的世界。在此过程中，你将掌握 AI 视频摘要、LLM 微调和 AI 图像生成等技能。

强烈建议观看李宏毅老师的课程「生成式人工智能导论」同步学习：课程相关链接快速访问

现在，项目还开设了🎡CodePlayground，你可以按照文档配置好环境，使用一行代码运行脚本，体验 AI 的魅力。

📑论文随笔位于 PaperNotes，将逐步上传大模型相关的基础论文。

🚀 基础镜像已经准备好，如果你还没有配置好属于自己的深度学习环境，不妨尝试一下 Docker。

祝你旅途愉快！

Tag 说明:
---: 基础知识，根据需要进行观看，也可以暂时跳过。其中的代码文件结果都会在文章中示出，但仍建议动手运行代码。可能会有显存要求。
API: 文章仅使用大模型的 API，不受设备限制，无 GPU 也可运行。
- Kaggle 目前不允许使用 Gradio，故部分交互文件不提供相关链接（这一类文件可以本地运行）。
LLM: 大型语言模型相关的实践，代码文件可能有显存要求。
SD: Stable Diffusion，文生图相关的实践，代码文件有显存要求。
Online 在线链接说明：
与 Code 内容一致，如果提供了 Kaggle 和 Colab，则三选一运行。
- 前置文章《Kaggle：免费 GPU 使用指南，Colab 的理想替代方案》
如果仅提供了 Colab，说明不受显卡限制可以本地运行，此时不能科学上网的同学可以下载 File 的代码，学习效果一致。
运行时请不要忘记打开对应在线平台的 GPU。
- Kaggle：Setting -> Accelerator -> 选择 GPU。
- Colab：代码执行程序 -> 更改运行时类型 -> 选择 GPU。

✨ New

好久不见，更新一篇 MCP 相关的中间文章，或许会对你有所帮助。

因为还没想好模块标题，所以暂时置顶。

目前项目将在叙述上全面使用 uv 进行环境的配置，这是一次并不“友好”的改动，但考虑到其目前已经被广泛应用，「长痛不如短痛」，索性从本项目开始“折腾”，希望能让你熟悉 uv 的使用。

Colab 链接因为原账户没绑定恢复邮箱，被暂停了外部访问且无法恢复（引以为戒），后续我会抽空迁移至新账户上。

DeepSeek 使用手册

这部分内容将直接由之前的文章（导论部分）重组得来，故存在重复，此模块将暂时专注于 DeepSeek API 的使用，是 OpenAI SDK 相关的通用知识，也可以作为导论 API 部分的拓展。

DeepSeek API【共享】

Guide	Tag	Describe	File	Online
DeepSeek API 的获取与对话示例	API	获取 DeepSeek API 的 N 种方法及其单轮对话样例：

DeepSeek 官方
硅基流动
阿里云百炼
百度智能云
字节火山引擎 | Code | Kaggle

Colab | | DeepSeek 联网满血版使用指南 | API | 通过 API 绕开 DeepSeek 网页对话的卡顿，提供两种配置方案：

Cherry Studio【推荐】
Chatbox | | | | DeepSeek API 输出解析 - OpenAI SDK | API | 关于 OpenAI SDK 的通用知识，以 DeepSeek 聊天/推理模型为例进行演示：
认识 API 的返回字段
打印模型回复和每次对话的用量信息

| Code | Kaggle

Colab | | └─流式输出解析 | API | API 解析 - 流式输出篇

认识 chunk 的结构
处理各平台聊天/推理模型的流式输出 | Code | Kaggle

Colab | | DeepSeek API 多轮对话 - OpenAI SDK | API | DeepSeek API 的多轮对话示例 - 非流式输出篇：

认识单轮对话和多轮对话时 messages 的差异
尝试封装对话类 | Code | Kaggle

Colab | | └─统一模型对话逻辑与流式输出 | API | - 统一聊天模型和推理模型对话类

引入流式输出处理

【代码文件】

使用 APIConfigManager 进行各平台配置，不再分散逻辑 | Code | Kaggle

Colab |

导论

Guide	Tag	Describe	File	Online
00. 大模型 API 获取步骤	API	带你一步步的获取 API：

阿里（通义千问）。
智谱。
DeepSeek。 | | | | 01. 初识 LLM API：环境配置与多轮对话演示 | API | 这是一段入门的配置和演示，对话代码修改自开发文档。 | Code | Kaggle

Colab | | 04. 认识 LoRA：从线性层到注意力机制 | --- | 在正式进入实践之前，你需要知道 LoRA 的基础概念，这篇文章会带你从线性层的 LoRA 实现到注意力机制。 | | | | 05. 理解 Hugging Face 的 AutoModel 系列：不同任务的自动模型加载类 | --- | 我们即将用到的模块是 Hugging Face 中的 AutoModel，这篇文章一样是一个前置知识，你将了解到如何查看模型的参数和配置信息，以及如何使用 inspect 库进一步查看对应的源码。 | Code | Kaggle

app_fastapi.py

app_flask.py | | | 07. 探究模型参数与显存的关系以及不同精度造成的影响 | --- | 了解模型参数和显存的对应关系并掌握不同精度的导入方式会使得你对模型的选择更加称手。 | | | | 08. 尝试微调 LLM：让它会写唐诗 | LLM | 这篇文章与 03. 进阶指南：自定义 Prompt 提升大模型解题能力一样，本质上是专注于“用”而非“写”，你可以像之前一样，对整体的流程有了一个了解，尝试调整超参数部分来查看对微调的影响。 | Code | Kaggle

Colab | | 09. 深入理解 Beam Search：原理, 示例与代码实现 | --- | 从示例到代码演示，讲解 Beam Search 的数学原理，这应该能解决一些之前阅读的困惑，最终提供一个简单的使用 Hugging Face Transformers 库的示例（如果跳过了之前的文章的话可以尝试它）。 | Code | Kaggle

Colab | | 10. Top-K vs Top-P：生成式模型中的采样策略与 Temperature 的影响 | --- | 进一步向你展示其他的生成策略。 | Code | Kaggle

Colab | | 14. PEFT：在大模型中快速应用 LoRA | --- | 学习如何在导入模型后增加 LoRA 层。 | Code | Kaggle

Colab-b | | 17. 浅谈 RTN 模型量化：非对称 vs 对称.md | --- | 更进一步地了解 RTN 模型量化的行为，文章以 INT8 为例进行讲解。 | Code | Kaggle

Colab | | 18. 模型量化技术概述及 GGUF & GGML 文件格式解析 | --- | 这是一个概述文章，或许可以解决一些你在使用 GGUF/GGML 时的疑惑。 | | | | 19a. 从加载到对话：使用 Transformers 本地运行量化 LLM 大模型（GPTQ & AWQ）

19b. 从加载到对话：使用 Llama-cpp-python 本地运行量化 LLM 大模型（GGUF） | LLM | 你将在自己的电脑上部署一个拥有 70 亿（7B）参数的量化模型，注意，这篇文章没有显卡要求。

19 a 使用 Transformers，涉及 GPTQ 和 AWQ 格式的模型加载。

19 b 使用 Llama-cpp-python，涉及 GGUF 格式的模型加载。

另外，你还将完成本地的大模型对话交互功能。 | Code - a

Colab - b | | 20. RAG 入门实践：从文档拆分到向量数据库与问答构建 | LLM | RAG 的相关实践。

了解文本分块的递归工作原理。 | Code | Kaggle

[Colab](https://colab.researc

Core symbols most depended-on inside this repo

check_installation

called by 5

CodePlayground/utils/environment_manager.py

load_config

called by 5

CodePlayground/utils/config_manager.py

debug_func_metadata

called by 4

Demos/mcp/debug_func_metadata.py

add_message

called by 4

CodePlayground/chat.py

read_subtitle

called by 3

CodePlayground/summarizer.py

print_json

called by 2

Demos/mcp/debug_func_metadata.py

format_timestamp

called by 2

CodePlayground/summarizer.py

_append_user_message

called by 2

CodePlayground/chat.py

Shape

Function 39

Method 29

Class 9

Route 2

Languages

Python100%

Modules by API surface

CodePlayground/chat.py19 symbols

CodePlayground/sd_lora.py12 symbols

Demos/mcp/debug_message_validator.py11 symbols

CodePlayground/utils/environment_manager.py11 symbols

CodePlayground/summarizer.py8 symbols

Demos/mcp/debug_func_metadata.py6 symbols

Demos/mcp/server.py4 symbols

Demos/app_fastapi.py3 symbols

CodePlayground/utils/config_manager.py3 symbols

Demos/app_flask.py2 symbols

Dependencies from manifests, versioned

accelerate1.9.0 · 1×

bitsandbytes0.46.1 · 1×

colorama0.4.6 · 1×

For agents

$ claude mcp add AI-Guide-and-Demos-zh_CN \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact

github.com/Hoper-J/AI-Guide-and-Demos-zh_CN @main sqlite

这是一个中文的 AI/LLM 大模型入门项目

目录

✨ New

DeepSeek 使用手册

导论

Core symbols most depended-on inside this repo

Shape

Languages

Modules by API surface

Dependencies from manifests, versioned

For agents