===============课程介绍===============
本课程是【手写AI】系列的王牌训练营,专为希望深入理解大语言模型(LLM)底层原理并掌握实际开发能力的学习者打造。课程以“手写”为核心,拒绝黑箱,带领你从零开始逐行实现Llama2核心组件,并延伸至主流模型(ChatGLM、CodeGeeX)的微调与前沿应用开发,助你成为LLM领域的实战高手。
===============课程目录===============代码.zip
(1)\LLM大模型视频;目录中文件数:0个
(2)\文档;目录中文件数:5个
sft高效微调.PDF
大语言模型(Large Language Model,LLM)综述.PDF
手写llama2源码.PDF
配置服务器的jupyter环境.PDF
面试.PDF
(3)\LLM大模型视频\季康部分;目录中文件数:43个
0-课程大纲简要说明.mp4
1-llm简要概览.mp4
10-1.1_llama2任务简介.mp4
10-1.2_rams数据处理_1.mp4
10-1.2_rams数据处理_2.mp4
10-1.3_lora原理部分介绍.mp4
10-1.4_llama2环境安装以及部分bug排查.mp4
10-1.5_lora训练.mp4
10-1.6_lora推理部分_问题生成.mp4
10-1.7_lora_推理_fewshot回答.mp4
10-1.8_int8量化原理.mp4
10.1.10_qlora的代码.mp4
10.1.9_qlora的nf4.mp4
10.1.9_qlora的双重量化.mp4
2-llm的发展历程_part1.mp4
2-llm的发展历程_part2.mp4
3-llm的训练流程以及常见的概念.mp4
4-llm的常见架构.mp4
5-llm的评价标准.mp4
6-1.1_llm的幻觉定义.mp4
6-1.2幻觉的评估方法.mp4
6-1.3幻觉产生的原因.mp4
6-1.4_llm幻觉的常见的解决方式.mp4
6-1.5_llm的知识编辑.mp4
7-llm自动生成prompts.mp4
8-1.1_Llama2的rmsnorm_原理.mp4
8-1.2_Llama2的rmsnorm_代码.mp4
8-1.3_Llama2的ROPE_原理.mp4
8-1.4_Llama2的ROPE_代码.mp4
8-1.5_Llama2的Attention_原理.mp4
8-1.6_Llama2的Attention_代码.mp4
8-1.6_Llama2的Attention_代码_ev.mp4
8-1.7_Llama2的ffn_原理.mp4
8-1.8_Llama2的ffn_代码.mp4
8-1.9_llama2模型组装.mp4
9-1.1pet原理&dataloader.mp4
9-1.2pet模型和训练验证.mp4
9-1.3ptuningv1原理以及代码.mp4
9-1.4ptuningv2原理.mp4
9-1.5ptuningv2_代码1.mp4
9-1.6ptuningv2_代码2.mp4
9-1.7ptuningv2_代码3.mp4
移动H盘.bat
(4)\LLM大模型视频\布丁部分;目录中文件数:55个
0_课程介绍.mp4
10_prompt_改写任务2.mp4
11_prompt_抽取任务1.mp4
12_prompt_抽取任务2.mp4
13_prompt角色扮演.mp4
14_prompt_数据制作1.mp4
15_prompt_数据制作2.mp4
16_prompt_数据制作3.mp4
17_prompt_数据制作4.mp4
18_deepspeed_概述.mp4
19_deepspeed_配置.mp4
1_模型文件下载方法1.mp4 .mp4
21_deepspeed_demo实例.mp4
22_deepspeed_bert_1.mp4
23_deepspeed_bert_2.mp4
24_deepspeed_bert_3.mp4
25_deepspeed_bert_4.mp4
26_deepspeed_多机多卡配置.mp4
27_chatglm3_新特性.mp4
28_chatglm3_新特2.mp4
29_流式与非流式_chat_generate.mp4
2_模型文件下载方法2.mp4 .mp4
30_glm2的tokenizer.mp4
31_推理、训练、量化占用显存.mp4
32_chatglm全量微调1.mp4
33_chatglm全量微调2-cpu交换技术.mp4
34_chatglm全量微调3-.mp4
35_微调结果评测.mp4
36_微调模型加载1.mp4
37_微调结束后-推理.mp4
38-微调优化.mp4
39-codegeex微调-数据准备.mp4
3_配置服务器jupyter环境.mp4 .mp4
40-codegeex-微调数据处理.mp4
41-codegeex-微调结果评测.mp4
42-function-call概述.mp4
43-function_call概述2.mp4
44-function-call实例1.mp4
45-手写function_call-1.mp4
46-手写function_call-2.mp4
47-streamlit-debug环境配置.mp4
48_function-all_官方代码逐行解读.mp4
49_code-interpreter-概述.mp4
4_vscode远程连接服务器.mp4 .mp4
50_手写code-interpreter.mp4
51_code-interpreter进阶.mp4
52_项目演示.mp4
53_akshare接口.mp4
54_gradio-界面设计.mp4
55_手写项目.mp4
5_vscode远程debug配置.mp4 .mp4
6_prompt_概述.mp4
7_prompt_技巧.mp4
8_prompt_技巧2.mp4
9_prompt_改写任务1.mp4
(5)\LLM大模型视频\季康部分\1_LLM综述;目录中文件数:0个
(6)\LLM大模型视频\季康部分\2_手写llama2源码;目录中文件数:0个
(7)\LLM大模型视频\季康部分\3_高效微调;目录中文件数:0个
(8)\LLM大模型视频\布丁部分\1_环境;目录中文件数:0个
(9)\LLM大模型视频\布丁部分\2_prompt;目录中文件数:0个
(10)\LLM大模型视频\布丁部分\3_微调;目录中文件数:0个
(11)\LLM大模型视频\布丁部分\4_function_call;目录中文件数:0个
(12)\LLM大模型视频\布丁部分\5_code_interpreter;目录中文件数:0个
有需要联系v;加客服窗口的联系方式
摘要:保姆级LLM大模型训练营以手写Llama2和ChatGLM微调、DP分布式训练以及Function Call项目实战为核心,全面覆盖大语言模型从基础构建到高级应用的完整流程。课程结合理论讲解与实操演练,系统解析模型架构、数据预处理、训练策略以及高效部署方法,帮助学习者掌握大模型开发与优化的核心技能。通过分布式训练和功能调用实战,学员可以快速上手实际项目,实现从数据标注到模型微调再到高性能应用部署的全流程掌控,充分提升模型理解能力与工程能力。训练营内容深入浅出、循序渐进,既适合初学者快速入门,也为有经验的开发者提供高阶优化技巧,是实现LLM技术落地的最佳实践路径。
1、Llama2模型手写实现
Llama2模型手写实现是训练营的重要环节,通过从零构建模型架构,学员能够深刻理解Transformer核心机制和注意力机制的运作方式。课程首先介绍了模型的输入编码、嵌入层设计以及多头注意力的实现原理,使学员对模型结构有系统性的认识。
在手写过程中,训练营强调代码的可读性与模块化设计,每个组件均独立实现并可单元测试。这不仅帮助学员理清模型内部逻辑,也为后续微调和优化打下坚实基础。
通过具体案例,学员学习了如何构建前向传播和反向传播的完整流程,并结合PyTorch实现梯度计算与参数更新,从而掌握模型训练的核心技术点。同时,通过手写模型,学员能够理解不同层次对模型性能的影响。
2、ChatGLM微调方法
ChatGLM微调部分重点讲解了如何在预训练模型基础上进行任务适配。训练营通过实例演示数据准备、标签设计以及训练参数设置,使学员熟悉微调流程中的各项细节。
课程深入分析了不同微调策略的优劣,包括全量微调、LoRA低秩适配和P-Tuning等方法,并通过实验对比展示各策略在性能和计算成本上的差异,使学员能够根据实际需求选择最优方案。
在微调实践中,训练营结合真实任务数据,如问答生成、文本摘要和对话模拟,帮助学员掌握模型输出质量评估方法,并通过自动化指标和人工评测相结合,实现微调效果的精细化管理。
3、DP分布式训练技巧
DP分布式训练是提升大模型训练效率的关键环节。训练营首先讲解数据并行和模型并行的基本概念,明确不同并行策略在内存占用、通信开销和训练速度上的差异。
课程通过代码示例展示如何在多GPU环境下实现DP训练,包括数据分片、梯度同步和优化器状态管理。学员可以直观理解分布式训练的复杂性及调优方法。
此外,训练营还引入混合精度训练和梯度累积技术,通过降低显存占用和提升计算效率,使学员能够在有限资源下完成大模型训练。同时,课程强调调试与性能监控技巧,帮助学员快速定位训练瓶颈。
4、Function Call项目实战
Function Call项目实战将理论与工程应用紧密结合,通过构建可调用函数接口,实现模型在真实场景中的功能落地。训练营通过案例演示如何设计函数调用接口、定义输入输出格式以及实现异常处理机制。
课程详细讲解了函数调用与模型推理的集成方式,使学员掌握如何将微调后的模型与应用系统无缝对接。通过实际项目练习,学员可以实现对话机器人、数据查询和自动化文本处理等功能。
在项目实战中,训练营强调从需求分析到代码实现的完整流程,确保学员不仅能运行功能,还能理解背后的设计理念与优化策略,从而培养解决实际问题的能力。
总结:
保姆级LLM大模型训练营通过手写Llama2模型、ChatGLM微调、DP分布式训练和Function Call项目实战,构建了一个理论与实践高度融合的学习体系。学员不仅掌握了模型构建与优化的核心技术,还能独立完成大模型在真实项目中的应用部署。
整体训练营注重系统性、操作性和落地性,使学员在短时间内获得全栈能力,从模型理解、微调技巧到分布式训练与功能落地,实现LLM开发的全流程掌握,具备应对实际工程挑战的能力。
本文由nayona.cn整理
联系我们

关注公众号

微信扫一扫
支付宝扫一扫
