《大模型项目实战:多领域智能应用开发》高强文【文字版_PDF电子书】_计算机类

如何自学 占星术 占星教程网盘 塔罗牌教程百度网盘

《大模型项目实战:多领域智能应用开发》高强文【文字版_PDF电子书_】

《大模型项目实战:多领域智能应用开发》封面图片

书名:大模型项目实战
作者:高强文
出版社:机械工业出版社
译者:
出版日期:2024-09
页数:/
ISBN:9787111762348
0.0
豆瓣评分
全网资源sm.nayona.cn

内容简介:

本书系统地讲解了大语言模型的实战应用过程,涵盖基础知识、常见操作和应用开发3个方面,帮助大语言模型的使用者、应用开发者循序渐进地掌握大模型的原理、操作以及多个场景下的应用开发技能。全书共18章,分为三篇:?基础篇介绍大语言模型的基础知识、应用架构和应用工作模式。?操作篇详细讲解大模型的实操环节,包括环境搭建、多种有代表性的开源大语言模型的安装、微调与量化等常见操作。?开发篇讲述大语言模型在Chat、辅助编程、RAG、翻译、AI Agent、智能语音对话、数字人、模型训练、AI小镇这9个领域的应用开发过程,从工作原理、源码分析、部署运行和测试验证等方面进行了详细介绍。中间还穿插讲解了VS Code插件的开发,丰富了应用运行的场景。

作者简介:

高强文

互链高科(北京)技术发展有限公司总经理,银川方达电子系统工程有限公司董事长,宁夏回族自治区劳动模范。专注于人工智能大语言模型应用开发、开源社区开发与运营。参加工作20多年来,一直从事医疗健康领域信息化、人工智能等产品研发与管理工作,近年来致力于开源事业,开发运营aliendao.cn、gitclone.com和opendao.cn等开源社区,在GitHub上贡献了20多个开源代码库。

目  录:

前 言

基础篇

第1章 大语言模型的基础知识 3

1.1 大语言模型概述 4

1.1.1 基本情况 4

1.1.2 发展历史 4

1.1.3 发展现状 6

1.1.4 发展趋势 7

1.2 基本原理 7

1.2.1 Transformer架构 8

1.2.2 编码器与解码器 8

1.2.3 自注意力机制 9

1.3 应用开发技术 11

1.3.1 Python 11

1.3.2 React.js 11

1.4 训练方法 12

1.4.1 FFT 12

1.4.2 RLHF 13

1.4.3 P-Tuning 13

1.4.4 LoRA 13

1.5 常见现象 13

1.5.1 幻觉 14

1.5.2 灾难性遗忘 14

1.5.3 涌现 14

1.5.4 价值对齐 15

第2章 大语言模型应用架构 16

2.1 整体架构 16

2.2 基础设施 17

2.2.1 硬件部分 17

2.2.2 操作系统 18

2.3 基础软件 18

2.3.1 CUDA 18

2.3.2 PyTorch 18

2.3.3 Anaconda 19

2.3.4 Nginx 19

2.4 应用软件 20

2.4.1 大语言模型文件 20

2.4.2 Transformers库 20

2.4.3 服务程序 20

2.4.4 API 21

2.4.5 客户端程序 21

第3章 大语言模型应用的工作模式 22

3.1 硬件部署 22

3.2 应用软件部署 23

3.3 运行模式 24

3.3.1 模型API服务的工作模式 24

3.3.2 模型API服务的运行过程 25

3.3.3 前后端交互方法 26

3.3.4 前端实现 27

操作篇

第4章 应用环境搭建 31

4.1 基础设施 31

4.1.1 服务器要求 31

4.1.2 操作系统准备 31

4.1.3 推理卡安装 32

4.2 基础软件安装 32

4.2.1 Linux 32

4.2.2 Windows 40

4.3 其他软件安装 41

4.3.1 Nginx 41

4.3.2 Git 42

第5章 大语言模型安装 43

5.1 ChatGLM安装 43

5.1.1 ChatGLM3模型介绍 43

5.1.2 ChatGLM3-6B安装 44

5.1.3 编程验证 45

5.2 Qwen-VL安装 47

5.2.1 Qwen模型介绍 47

5.2.2 Qwen-VL-Chat-Int4安装 47

5.2.3 编程验证 49

5.3 LLaMA2安装 50

5.3.1 LLaMA2模型介绍 50

5.3.2 Llama-2-7b-chat安装 51

5.3.3 运行验证 51

5.4 Gemma安装 54

5.4.1 Gemma模型介绍 54

5.4.2 Gemma-2B安装 55

5.4.3 编程验证 55

5.5 Whisper安装 57

5.5.1 Whisper-large-v3介绍 57

5.5.2 Whisper-large-v3安装 57

5.5.3 编程验证 58

第6章 大语言模型微调 60

6.1 ChatGLM微调 60

6.1.1 微调方法介绍 61

6.1.2 微调环境准备 61

6.1.3 语料准备 62

6.1.4 模型下载 65

6.1.5 微调过程 65

6.1.6 微调模型测试 67

6.2 LLaMA2微调 68

6.2.1 微调方法介绍 68

6.2.2 微调环境准备 69

6.2.3 语料准备 70

6.2.4 模型下载 71

6.2.5 微调过程 71

6.2.6 PEFT微调模型测试 73

6.2.7 模型合并 74

6.2.8 合并后模型测试 74

6.3 Gemma微调 74

6.3.1 微调方法介绍 74

6.3.2 微调环境准备 75

6.3.3 模型下载 75

6.3.4 微调程序开发 75

6.3.5 语料文件下载 77

6.3.6 微调与测试过程 78

第7章 大语言模型量化 79

7.1 量化介绍 79

7.2 llama.cpp量化过程 80

7.2.1 llama.cpp编译 80

7.2.2 模型GGUF格式转换 81

7.2.3 模型下载 81

7.2.4 量化过程 81

7.2.5 量化模型测试 82

7.2.6 Web方式运行 82

7.3 gemma.cpp量化过程 83

7.3.1 gemma.cpp源码下载 83

7.3.2 gemma.cpp编译 83

7.3.3 量化模型下载 84

7.3.4 推理 84

第8章 多模态模型应用 86

8.1 Stable Diffusion介绍 86

8.2 Stable Diffusion部署 87

8.2.1 代码获取 87

8.2.2 Python虚拟环境准备 87

8.2.3 依赖库安装 87

8.2.4 模型下载 88

8.2.5 服务运行 88

8.3 Stable Diffusion应用 88

8.3.1 文生图应用 89

8.3.2 图生图应用 90

开发篇

第9章 Chat应用 94

9.1 目标 94

9.2 原理 94

9.2.1 功能概要 94

9.2.2 系统架构 95

9.2.3 运行原理 96

9.3 开发过程 96

9.3.1 Node.js安装 96

9.3.2 chat-app新建 96

9.3.3 源代码 97

9.3.4 测试 98

9.3.5 应用发布 99

第10章 辅助编程应用 102

10.1 目标 103

10.2 原理 103

10.2.1 功能概要 103

10.2.2 系统架构 103

10.2.3 运行原理 104

10.3 开发过程 104

10.3.1 开发环境准备 104

10.3.2 测试模型准备 105

10.3.3 API服务实现 106

10.3.4 测试 110

第11章 VS Code插件 112

11.1 目标 112

11.2 原理 112

11.2.1 功能概要 112

11.2.2 系统架构 113

11.2.3 运行原理 114

11.3 开发过程 114

11.3.1 环境准备与项目创建 115

11.3.2 插件开发 115

11.3.3 插件发布 118

第12章 检索增强生成应用 121

12.1 目标 121

12.2 原理 122

12.2.1 功能概要 122

12.2.2 系统架构 123

12.2.3 运行原理 124

12.3 开发过程 125

12.3.1 大语言模型安装 125

12.3.2 依赖库安装 125

12.3.3 向量化模型下载 126

12.3.4 源代码 126

12.3.5 测试 128

第13章 PDF翻译应用 130

13.1 目标 130

13.2 原理 130

13.2.1 功能概要 130

13.2.2 系统架构 131

13.2.3 运行原理 131

13.3 开发过程 135

13.3.1 大语言模型安装 135

13.3.2 依赖环境安装 135

13.3.3 下载英译中模型 135

13.3.4 源代码 136

13.3.5 测试 138

第14章 智能代理应用 140

14.1 目标 140

14.2 原理 141

14.2.1 AI Agent 141

14.2.2 AutoGen 141

14.3 开发过程 143

14.3.1 大语言模型安装 143

14.3.2 Docker安装 144

14.3.3 虚拟环境准备 145

14.3.4 运行环境验证 145

14.3.5 多代理会话应用开发 146

第15章 语音模型应用 149

15.1 目标 149

15.2 原理 149

15.2.1 功能概要 149

15.2.2 系统架构 150

15.2.3 运行原理 151

15.3 开发过程 152

15.3.1 运行环境安装 152

15.3.2 模型下载 153

15.3.3 Demo运行 153

15.3.4 服务端开发 154

15.3.5 客户端开发 160

15.3.6 测试 163

第16章 数字人应用 166

16.1 目标 166

16.2 原理 167

16.2.1 功能概要 167

16.2.2 系统架构 167

16.2.3 运行原理 168

16.3 开发过程 169

16.3.1 环境准备 169

16.3.2 源代码 173

16.3.3 测试 177

第17章 提示词生成应用:从零训练

模型 179

17.1 目标 179

17.2 原理 180

17.2.1 GPT-2 180

17.2.2 训练流程与应用架构 181

17.2.3 训练方法与运行原理 182

17.3 开发与训练过程 185

17.3.1 语料整理 186

17.3.2 训练 188

17.3.3 推理与服务 196

17.3.4 测试 202

第18章 AI小镇应用 204

18.1 目标 204

18.2 原理 205

18.2.1 功能概要 205

18.2.2 系统架构 206

18.2.3 运行原理 207

18.3 开发过程 209

18.3.1 大语言模型安装 210

18.3.2 开发环境搭建 210

18.3.3 地图制作 210

18.3.4 app.js 211

18.3.5 BootScene.js 213

18.3.6 GameScene.js 213

18.3.7 ChatUtils.js 218

18.3.8 测试 219

浏览器不支持脚本!

有需要联系v;hx-hx4

摘要:《大模型项目实战:多领域智能应用开发》是一本详细介绍如何开发多领域智能应用的技术书籍,作者高强文通过实际案例,帮助读者深入理解大模型在各个行业中的应用,尤其是计算机科学领域。书中不仅涉及大模型的基础理论,还涵盖了如何根据实际需求选择合适的算法、框架和工具,构建智能系统。本书主要通过项目实战的形式,深入探讨了大模型在语音识别、自然语言处理、图像识别等领域的应用,展现了如何将理论转化为实践,帮助读者提升在智能应用开发中的能力和实战经验。此外,书中还对当前的技术难题和挑战进行了分析,并提供了相应的解决方案,具有很高的实用价值。对于希望深入了解大模型技术的开发人员和技术爱好者来说,这本书无疑是一本值得推荐的参考资料。

1、大模型的基本概念与技术框架

《大模型项目实战:多领域智能应用开发》一书的第一部分主要介绍了大模型的基本概念。大模型(Large Models)是指参数规模庞大的机器学习模型,通常包含数十亿甚至更多的参数。这些模型在多个领域的智能应用中都表现出了卓越的性能,尤其是在自然语言处理和图像识别等任务中。作者高强文从理论角度深入浅出地介绍了大模型的基本构成,并详细解释了其背后的数学原理,如深度神经网络的层次结构、反向传播算法等,帮助读者打下扎实的理论基础。

在技术框架方面,本书介绍了多种常见的深度学习框架和工具,包括TensorFlow、PyTorch等开源框架,并分析了它们在大模型训练中的优缺点。作者强调了选择合适框架的重要性,因为不同的框架在处理大规模数据和训练高效算法时有不同的表现。此外,书中还探讨了分布式训练、混合精度计算等技术,阐明了如何高效地利用硬件资源进行大规模模型训练。

通过对这些基本概念和技术框架的介绍,读者可以全面了解大模型的工作原理,以及如何选择合适的技术手段来进行实际开发。这部分内容不仅适合初学者,也为有一定基础的技术人员提供了深入的指导。

2、智能应用的领域与实践

《大模型项目实战:多领域智能应用开发》不仅仅停留在理论层面,还通过具体的案例,详细讲解了大模型在多个智能应用领域中的实际运用。首先,书中重点介绍了自然语言处理(NLP)领域中的应用。大模型在NLP中的应用已经取得了显著的突破,例如文本生成、情感分析、机器翻译等任务。作者通过实际代码示例,展示了如何使用大模型进行文本数据的处理,帮助读者理解复杂的NLP任务。

其次,书中还探讨了大模型在语音识别领域的应用。语音识别技术在近年来得到了广泛的应用,尤其是在智能助手、自动客服等领域。通过对大模型在语音识别中的应用,作者展示了如何利用深度学习模型处理大量语音数据,并实现高准确率的识别效果。书中的案例详细说明了数据预处理、模型训练、模型评估等过程,帮助读者掌握构建语音识别系统的核心技能。

此外,图像识别是大模型应用的另一个重要领域。随着计算机视觉技术的发展,大模型在图像分类、目标检测、图像生成等任务中表现出色。书中通过具体的项目实战,展示了如何利用大模型进行图像数据的处理与分析,特别是在医疗影像分析、安防监控等行业中的应用,给出了丰富的实践经验。

3、技术难点与解决方案

尽管大模型在各个领域取得了令人瞩目的成就,但其开发和应用过程中仍然面临许多技术难题。书中专门为读者解析了这些难点,并提供了切实可行的解决方案。首先,大模型训练所需的数据量和计算资源通常非常庞大,这对硬件设施提出了很高的要求。高强文在书中介绍了如何通过分布式计算、数据并行化等手段,克服资源不足的问题,提高训练效率。

其次,大模型的训练过程往往非常复杂,涉及到大量的超参数调优。如何选择合适的超参数、优化算法、正则化方法等,直接关系到模型的性能。作者通过案例演示,展示了常见的调参技巧和调优策略,帮助读者在面对复杂的调参问题时能够从容应对。

此外,过拟合问题是大模型训练中常见的难点,尤其是在数据量有限的情况下。为了避免过拟合,书中介绍了多种正则化技术,如Dropout、数据增强等,并结合实际案例,指导读者如何在不同场景下应用这些技术来提高模型的泛化能力。

4、项目实战与实用技巧

本书的核心优势之一是通过项目实战的形式,将理论与实践紧密结合。在每个智能应用领域的讲解之后,作者都设计了一个完整的项目实战,涵盖从数据预处理到模型训练再到最终评估的全过程。通过这些项目,读者能够掌握如何将大模型技术应用于实际的工作中,解决实际问题。

在项目实战的过程中,书中还提炼了许多实用的技巧。例如,在数据预处理阶段,如何高效地清洗和转换数据;在模型训练阶段,如何选择合适的训练策略以加速模型收敛;在模型评估阶段,如何使用多种评估指标全面评估模型的性能等。这些技巧不仅可以帮助读者避免常见的开发陷阱,还能够提升其在实际项目中的工作效率。

通过项目实战,读者不仅能掌握大模型的开发技巧,还能够在解决实际问题时积累宝贵的经验。此外,本书还特别关注了开发过程中的常见挑战和难题,帮助读者在实际工作中避免走弯路,提高开发效率和项目质量。

总结:

《大模型项目实战:多领域智能应用开发》是一本实用性极强的技术书籍,通过多领域的智能应用案例,帮助读者理解大模型在实际开发中的运用。书中的内容覆盖了从大模型的基础理论到实际项目开发的全流程,尤其是对于初学者来说,具有很大的帮助。通过大量的项目实战,读者能够逐步提高自己的开发能力,并掌握如何解决实际开发中遇到的技术难题。

无论你是刚刚接触大模型的初学者,还是已经有一定经验的开发者,这本书都能为你提供宝贵的知识和技能,帮助你在智能应用开发的道路上走得更远。对那些有志于在大模型领域深入发展的技术人员来说,这本书无疑是一本值得收藏和反复阅读的经典之作。

本文由nayona.cn整理

点击联系需要东西方神秘学学习资料,专业的咨询

有需要联系v;hx-hx3 有需要联系v;hx-hx3 有需要联系v;hx-hx3如果对你有一点点帮助,欢迎打赏~~~  
图片1

联系我们

图片2

关注公众号

打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
雅书雅书
上一篇 2024年11月11日 下午10:52
下一篇 2024年11月11日 下午10:53

相关推荐