回顾过去的学习历程,吴恩达和李宏毅老师的视频为我的深度学习之路提供了极大的帮助。他们幽默风趣的讲解方式和简单直观的阐述,让枯燥的理论学习变得生动有趣。
然而,在实践的时候,许多学弟学妹们最初会烦恼于怎么去获取国外大模型的 API ,尽管最终都能找到解决方法,但第一次的畏难情绪总是会拖延学习进度,逐渐转变为“看视频就够了”的状态。我时常在评论区看到类似的讨论,于是决定利用闲暇时间帮学子们跨过这道门槛,这也是项目的初衷。
本项目不会提供🪜科学上网的教程,也不会依赖平台自定义的接口,而是使用更兼容的 OpenAI SDK,帮助大家学习更通用的知识。
项目将从简单的 API 调用入手,带你逐步深入大模型的世界。在此过程中,你将掌握 AI 视频摘要、LLM 微调和 AI 图像生成等技能。
强烈建议观看李宏毅老师的课程「生成式人工智能导论」同步学习:课程相关链接快速访问
现在,项目还开设了🎡CodePlayground,你可以按照文档配置好环境,使用一行代码运行脚本,体验 AI 的魅力。
📑论文随笔位于 PaperNotes,将逐步上传大模型相关的基础论文。
🚀 基础镜像已经准备好,如果你还没有配置好属于自己的深度学习环境,不妨尝试一下 Docker。
祝你旅途愉快!
---: 基础知识,根据需要进行观看,也可以暂时跳过。其中的代码文件结果都会在文章中示出,但仍建议动手运行代码。可能会有显存要求。API: 文章仅使用大模型的 API,不受设备限制,无 GPU 也可运行。LLM: 大型语言模型相关的实践,代码文件可能有显存要求。SD: Stable Diffusion,文生图相关的实践,代码文件有显存要求。File 的代码,学习效果一致。Setting -> Accelerator -> 选择 GPU。代码执行程序 -> 更改运行时类型 -> 选择 GPU。好久不见,更新一篇 MCP 相关的中间文章,或许会对你有所帮助。
因为还没想好模块标题,所以暂时置顶。
目前项目将在叙述上全面使用 uv 进行环境的配置,这是一次并不“友好”的改动,但考虑到其目前已经被广泛应用,「长痛不如短痛」,索性从本项目开始“折腾”,希望能让你熟悉 uv 的使用。
Colab 链接因为原账户没绑定恢复邮箱,被暂停了外部访问且无法恢复(引以为戒),后续我会抽空迁移至新账户上。
这部分内容将直接由之前的文章(导论部分)重组得来,故存在重复,此模块将暂时专注于 DeepSeek API 的使用,是 OpenAI SDK 相关的通用知识,也可以作为导论 API 部分的拓展。
| Guide | Tag | Describe | File | Online |
|---|---|---|---|---|
| DeepSeek API 的获取与对话示例 | API | 获取 DeepSeek API 的 N 种方法及其单轮对话样例: |
Colab | | DeepSeek 联网满血版使用指南 | API | 通过 API 绕开 DeepSeek 网页对话的卡顿,提供两种配置方案:
Cherry Studio【推荐】
Chatbox | | | | DeepSeek API 输出解析 - OpenAI SDK | API | 关于 OpenAI SDK 的通用知识,以 DeepSeek 聊天/推理模型为例进行演示:
认识 API 的返回字段
打印模型回复和每次对话的用量信息
Colab | | └─流式输出解析 | API | API 解析 - 流式输出篇
Colab | | DeepSeek API 多轮对话 - OpenAI SDK | API | DeepSeek API 的多轮对话示例 - 非流式输出篇:
Colab | | └─统一模型对话逻辑与流式输出 | API | - 统一聊天模型和推理模型对话类
【代码文件】
Colab |
| Guide | Tag | Describe | File | Online |
|---|---|---|---|---|
| 00. 大模型 API 获取步骤 | API | 带你一步步的获取 API: |
阿里(通义千问)。
智谱。
DeepSeek。 | | | | 01. 初识 LLM API:环境配置与多轮对话演示 | API | 这是一段入门的配置和演示,对话代码修改自开发文档。 | Code | Kaggle
Colab | | 02. 简单入门:通过 API 与 Gradio 构建 AI 应用 | API | 指导如何去使用 Gradio 搭建一个简单的 AI 应用。 | Code | Colab | | 03. 进阶指南:自定义 Prompt 提升大模型解题能力 | API | 你将学习自定义一个 Prompt 来提升大模型解数学题的能力,其中一样会提供 Gradio 和非 Gradio 两个版本,并展示代码细节。 | Code | Kaggle
Colab |
| 04. 认识 LoRA:从线性层到注意力机制 | --- | 在正式进入实践之前,你需要知道 LoRA 的基础概念,这篇文章会带你从线性层的 LoRA 实现到注意力机制。 | | |
| 05. 理解 Hugging Face 的 AutoModel 系列:不同任务的自动模型加载类 | --- | 我们即将用到的模块是 Hugging Face 中的 AutoModel,这篇文章一样是一个前置知识,你将了解到如何查看模型的参数和配置信息,以及如何使用 inspect 库进一步查看对应的源码。 | Code | Kaggle
Colab | | 06. 开始实践:部署你的第一个语言模型 | LLM | 实现非常入门的语言模型部署,项目到现在为止都不会有 GPU 的硬性要求,你可以继续学习。 | Code
app_flask.py | | | 07. 探究模型参数与显存的关系以及不同精度造成的影响 | --- | 了解模型参数和显存的对应关系并掌握不同精度的导入方式会使得你对模型的选择更加称手。 | | | | 08. 尝试微调 LLM:让它会写唐诗 | LLM | 这篇文章与 03. 进阶指南:自定义 Prompt 提升大模型解题能力一样,本质上是专注于“用”而非“写”,你可以像之前一样,对整体的流程有了一个了解,尝试调整超参数部分来查看对微调的影响。 | Code | Kaggle
Colab | | 09. 深入理解 Beam Search:原理, 示例与代码实现 | --- | 从示例到代码演示,讲解 Beam Search 的数学原理,这应该能解决一些之前阅读的困惑,最终提供一个简单的使用 Hugging Face Transformers 库的示例(如果跳过了之前的文章的话可以尝试它)。 | Code | Kaggle
Colab | | 10. Top-K vs Top-P:生成式模型中的采样策略与 Temperature 的影响 | --- | 进一步向你展示其他的生成策略。 | Code | Kaggle
Colab | | 11. DPO 微调示例:根据人类偏好优化 LLM 大语言模型 | LLM | 一个使用 DPO 微调的示例。 | Code | Kaggle
Colab | | 12. Inseq 特征归因:可视化解释 LLM 的输出 | LLM | 翻译和文本生成(填空)任务的可视化示例。 | Code | Kaggle
Colab | | 13. 了解人工智能可能存在的偏见 | LLM | 不需要理解代码,可以当作休闲时的一次有趣探索。 | Code | Kaggle
Colab | | 14. PEFT:在大模型中快速应用 LoRA | --- | 学习如何在导入模型后增加 LoRA 层。 | Code | Kaggle
Colab | | 15. 用 API 实现 AI 视频摘要:动手制作属于你的 AI 视频助手 | API & LLM | 你将了解到常见的 AI 视频总结小助手背后的原理,并动手实现 AI 视频摘要。 | Code - 完整版
Colab | | 16. 用 LoRA 微调 Stable Diffusion:拆开炼丹炉,动手实现你的第一次 AI 绘画 | SD | 使用 LoRA 进行文生图模型的微调,现在你也能够为别人提供属于你的 LoRA 文件。 | Code
Colab-b | | 17. 浅谈 RTN 模型量化:非对称 vs 对称.md | --- | 更进一步地了解 RTN 模型量化的行为,文章以 INT8 为例进行讲解。 | Code | Kaggle
Colab | | 18. 模型量化技术概述及 GGUF & GGML 文件格式解析 | --- | 这是一个概述文章,或许可以解决一些你在使用 GGUF/GGML 时的疑惑。 | | | | 19a. 从加载到对话:使用 Transformers 本地运行量化 LLM 大模型(GPTQ & AWQ)
19b. 从加载到对话:使用 Llama-cpp-python 本地运行量化 LLM 大模型(GGUF) | LLM | 你将在自己的电脑上部署一个拥有 70 亿(7B)参数的量化模型,注意,这篇文章没有显卡要求。
19 a 使用 Transformers,涉及 GPTQ 和 AWQ 格式的模型加载。
19 b 使用 Llama-cpp-python,涉及 GGUF 格式的模型加载。
另外,你还将完成本地的大模型对话交互功能。 | Code - a
Colab - b | | 20. RAG 入门实践:从文档拆分到向量数据库与问答构建 | LLM | RAG 的相关实践。
了解文本分块的递归工作原理。 | Code | Kaggle
[Colab](https://colab.researc
$ claude mcp add AI-Guide-and-Demos-zh_CN \
-- python -m otcore.mcp_server <graph>