《大型语言模型实战指南:应用实践与场景落地》刘聪【文字版_PDF电子书】_计算机类

如何自学 占星术 占星教程网盘 塔罗牌教程百度网盘

《大型语言模型实战指南:应用实践与场景落地》刘聪【文字版_PDF电子书_】

《大型语言模型实战指南:应用实践与场景落地》封面图片

书名:大型语言模型实战指南
作者:刘聪 等
出版社:机械工业出版社
译者:
出版日期:2024-08
页数:/
ISBN:9787111758457
0.0
豆瓣评分
全网资源sm.nayona.cn

内容简介:

这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的着作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AI Agent等各种强大的应用程序的着作。

本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:

(1)大型语言模型的基础理论,包括常见的模型架构、领域大型语言模型以及如何评估大模型的性能。

(2)大模型微调的关键步骤:从数据的收集、清洗到筛选,直至微调训练的技术细节。

(3)大模型人类偏好对齐方法,从基于人工反馈的强化学习框架到当前主流的对齐方法。

(4)通过GPTs快速搭建个性化的专属ChatGPT应用。

(5)通过开源模型在多种场景下搭建大模型应用,包括:表格查询、角色扮演、信息抽取、知识问答、AI Agent等。

(6)掌握大模型Agent方法以及Agent常用框架。

(7)基于LangChain框架构建一个AutoGPT应用。

本书集大模型理论、实践和场景落地于一体,提供大量经详细注释的代码,方便读者理解和实操。总之,不管里是想深入研究大模型本身,还是进行大模型相关应用搭建,本书都应该能给你颇具价值的技术启发与思考,让你在大模型的路上快速前行,少走弯路。

作者简介:

刘聪

资深NLP技术专家和AI技术专家,南京云问科技首席算法架构师,MLNLP(机器学习算法与自然语言处理)社区学术委员。主攻文本向量表征、问答系统、AIGC等技术方向,是大模型领域的先驱者和布道者。开源了首个中文Unilm预训练模型、中文GPT2、夸夸闲聊机器人(ChatBot)、大模型微调等项目。作为主要负责人,在多项自然语言处理比赛中获得前三名,在中文核心期刊和SCI发表多篇论文,有多项发明专利。知乎ID“刘聪NLP”,拥有公众号“NLP工作站”,撰写书籍《ChatGPT原理与实战》。

沈盛宇

资深算法工程师,南京云问网络技术有限公司算法组负责人。擅长结合用户业务场景,针对性设计知识图谱、问答、检索、多模态、AIGC等的相关算法和落地方案。在结合客户现有产品体系,推动数据中台和算法平台结合,从而提升服务质量方面,有丰富实战经验。曾获得多项国家专利,参与制定和撰写《IDP术语标准》《人工智能-智能助理能力等级评估标准》《人工智能标准化与开源研究报告》《ChatGPT原理与实战》等多项国家级人工智能标准和书籍。

李特丽

资深大模型应用专家,LangChain中文社区联合创始人,开发Langchain等多个大模型开发框架的中文网,帮助中国开发者快速学习AI开发框架,撰写书籍《LangChain入门指南》。

杜振东

资深NLP技术专家和AI技术专家,南京云问科技NLP研究院院长,国家人工智能标准委专家、AIIA 人工智能技术专家、CCF智能机器人专业组首批委员。拥有10年机器学习与文本挖掘经验,8年中文自然语言处理实战经验,参与制定6项国家人工智能总体组标准,编写书籍《会话式AI》《人工智能实践录》《ChatGPT原理与实战》等。

目  录:

前言

第1章 大型语言模型基础 1

1.1 Transformer基础 1

1.2 常用的大型语言模型 4

1.2.1 GPT系列模型 4

1.2.2 OPT模型 11

1.2.3 Bloom模型 12

1.2.4 GLM系列模型 12

1.2.5 LLaMA系列模型 14

1.2.6 Baichuan系列模型 16

1.2.7 Qwen系列模型 18

1.2.8 Skywork模型 19

1.3 领域大型语言模型 21

1.3.1 法律大型语言模型 21

1.3.2 医疗大型语言模型 24

1.3.3 金融大型语言模型 27

1.3.4 教育大型语言模型 29

1.4 大型语言模型评估 30

1.4.1 大型语言模型的评估内容 30

1.4.2 大型语言模型的评估方法 32

1.4.3 大型语言模型评估榜单 33

1.5 本章小结 37

第2章 大型语言模型的常用微调方法 38

2.1 数据构造与清洗 38

2.1.1 数据构造方法 39

2.1.2 数据清洗方法 43

2.2 分词器构造 44

2.2.1 分词器概述 44

2.2.2 BPE分词器 45

2.2.3 WordPiece分词器 52

2.2.4 Unigram分词器 56

2.2.5 SentencePiece分词器 58

2.2.6 词表融合 62

2.3 大型语言模型的微调方法 63

2.3.1 前缀调优 63

2.3.2 提示调优 64

2.3.3 P-Tuning v2 65

2.3.4 LoRA 65

2.3.5 DyLoRA 66

2.3.6 AdaLoRA 67

2.3.7 QLoRA 67

2.3.8 QA-LoRA 68

2.3.9 LongLoRA 69

2.3.10 VeRA 69

2.3.11 S-LoRA 70

2.4 基于PEFT的LLaMA模型微调实战 71

2.4.1 项目介绍 71

2.4.2 数据预处理 71

2.4.3 模型微调 72

2.4.4 模型预测 77

2.5 本章小结 78

第3章 大型语言模型的人类偏好对齐 79

3.1 基于人类反馈的强化学习框架 79

3.2 前沿偏好对齐方法 84

3.2.1 RRHF 84

3.2.2 RLAIF 85

3.2.3 DPO 87

3.2.4 APO 89

3.3 基于DPO的偏好对齐实战 90

3.3.1 数据集介绍 90

3.3.2 TRL框架介绍 92

3.3.3 训练代码解析 93

3.4 本章小结 96

第4章 创建个人专属的ChatGPT—GPTs 97

4.1 GPTs初体验 97

4.2 GPTs的初阶使用 105

4.2.1 知识库的使用 105

4.2.2 内置插件的使用 108

4.2.3 知识库与内置插件的结合使用 111

4.3 GPTs的高阶使用 113

4.4 本章小结 122

第5章 大型语言模型SQL任务实战 123

5.1 公开数据集 123

5.1.1 英文公开数据集 123

5.1.2 中文公开数据集 128

5.2 主流方法 132

5.2.1 基于规则的方法 133

5.2.2 基于深度学习的方法 133

5.2.3 基于预训练语言模型的方法 136

5.2.4 基于大型语言模型的方法 136

5.3 Text2SQL任务实战 141

5.3.1 项目介绍 141

5.3.2 数据预处理 142

5.3.3 模型微调 147

5.3.4 模型预测 149

5.4 本章小结 150

第6章 大型语言模型的角色扮演应用 151

6.1 角色扮演 151

6.1.1 大型语言模型如何进行角色扮演 153

6.1.2 角色扮演数据的构造方法 155

6.1.3 大型语言模型角色扮演的能力评估 155

6.2 角色扮演实战测试 156

6.3 基于Baichuan的角色扮演模型微调 159

6.3.1 项目介绍 159

6.3.2 数据预处理 160

6.3.3 模型微调 164

6.3.4 模型预测 171

6.4 本章小结 175

第7章 大型语言模型的对话要素抽取应用 176

7.1 对话要素抽取 176

7.2 对话要素抽取实战测试 177

7.2.1 基于GPT-3.5 API进行对话要素抽取 178

7.2.2 基于Qwen-1.8B模型进行对话要素抽取 180

7.3 基于Qwen的对话要素抽取模型微调 183

7.3.1 项目介绍 183

7.3.2 数据预处理 183

7.3.3 模型微调 190

7.3.4 模型预测 198

7.4 本章小结 202

第8章 Agent应用开发 203

8.1 Agent概述 203

8.2 Agent的主要模块 205

8.3 Agent的行为决策机制 207

8.4 主流Agent 框架 211

8.4.1 LangChain框架 211

8.4.2 LlamaIndex框架 214

8.4.3 AutoGPT框架 215

8.4.4 AutoGen 框架 216

8.4.5 SuperAGI框架 219

8.5 本章小结 221

第9章 基于知识库的大型语言模型问答应用 222

9.1 基于知识库问答 222

9.2 向量数据库 224

9.2.1 文本的向量表征 225

9.2.2 向量的距离度量方法 228

9.2.3 常用的向量数据库 229

9.3 基于知识库的大型语言模型问答实战 231

9.3.1 BGE微调 231

9.3.2 基于ChatGLM3知识库答案生成任务的微调 238

9.3.3 基于Streamlit 的知识库答案应用搭建 245

9.4 本章小结 249

第10 章 使用LangChain 构建一个AutoGPT 250

10.1 AutoGPT 概述 250

10.2 LangChain 概述 253

10.3 使用LangChain 构建AutoGPT 254

10.3.1 构建 254

10.3.2 规划和任务分解 255

10.3.3 输出解析 258

10.3.4 程序的核心AutoGPT类 261

10.3.5 工具能力配置 266

10.3.6 为Agent 配置记忆 269

10.4 运行AutoGPT 274

10.5 本章小结 277

浏览器不支持脚本!

有需要联系v;hx-hx4

摘要:《大型语言模型实战指南:应用实践与场景落地》是刘聪所著的一本计算机类书籍,全面介绍了大型语言模型(LLM)在各个领域的应用实践以及如何将其技术实现具体场景落地的过程。通过本书,读者可以深入了解如何基于先进的自然语言处理技术,在实际工作中提升生产力,解决业务中的具体问题。刘聪通过大量的实践案例和深入分析,展现了语言模型的强大能力和广泛的应用前景。从技术原理到应用场景的详细讲解,再到部署实施的具体方法,这本书为开发者、工程师以及技术爱好者提供了系统而实用的参考。本文将从四个方面详细分析《大型语言模型实战指南》内容,探讨它在人工智能领域的价值与影响。

1、大型语言模型的基本原理

《大型语言模型实战指南》首先对大型语言模型的基本原理进行了详细讲解,帮助读者理解其背后的技术基础。大型语言模型,尤其是像GPT系列、BERT系列等,主要依赖深度学习技术,尤其是Transformer架构的成功应用。Transformer通过自注意力机制(Self-Attention)使得模型能够捕捉文本中词语之间的复杂关系,提高了模型的表达能力和处理长文本的能力。书中对模型的工作原理进行了详细的解析,从词嵌入(Word Embedding)到层叠的编码器和解码器,每一步都有具体的案例进行说明。

除了基本原理,本书还讨论了大型语言模型在训练过程中的关键技术。为了能够处理海量数据,训练过程中需要进行大规模的并行计算,这也促使了分布式计算和高性能计算架构的进步。书中详细介绍了如何使用GPU、TPU等硬件加速模型训练,提升训练效率。通过对数据预处理、批量训练、损失函数优化等技术的讨论,读者可以深入了解如何在实际项目中高效训练大型语言模型。

在这一部分,刘聪还提到了深度学习中的一些关键挑战,例如梯度爆炸和消失问题、过拟合等问题。通过多种优化技术,如正则化、dropout、学习率衰减等手段,模型的性能得到了有效提升。此外,模型的可解释性也是本书提到的一个热点话题。如何理解模型的预测结果、如何提升模型的透明度,都是开发者在实际应用过程中需要重点关注的问题。

2、大型语言模型的实际应用

《大型语言模型实战指南》深入探讨了语言模型在不同领域的实际应用。首先是自然语言处理(NLP)领域,书中举例说明了如何将大型语言模型应用于文本分类、情感分析、机器翻译、语音识别等多个子任务。例如,通过fine-tuning技术,开发者可以将预训练的语言模型应用于特定领域的文本分类任务,大大提高了任务完成的效率和准确率。

除了NLP领域,刘聪还介绍了大型语言模型在其他行业中的应用,包括金融、医疗、法律等。以金融行业为例,语言模型能够自动从海量的新闻报道、财报中提取出关键信息,帮助分析师更快地做出投资决策。在医疗行业,语言模型被应用于辅助诊断、患者健康管理、医学文献的自动生成等方面。通过不断地优化和调试,语言模型能够为行业专家提供决策支持和自动化的工具。

另外,书中还提到了大型语言模型在创作领域的广泛应用。通过自然语言生成(NLG)技术,语言模型能够为用户生成文章、诗歌、新闻稿等内容。随着技术的进步,许多创意产业开始尝试将语言模型作为辅助工具,甚至是主创工具,提供更高效的内容生产方式。刘聪通过具体案例分析了大型语言模型在这些行业中的具体表现,阐述了其广泛的应用潜力。

3、大型语言模型的部署与实施

大型语言模型的部署与实施是本书中的重点之一。刘聪详细介绍了将训练好的模型投入实际生产环境中的步骤,包括模型的性能优化、部署架构设计、负载均衡、容错处理等内容。在实际应用中,许多企业会面临模型推理速度、响应时间、硬件资源等方面的挑战。为了提升模型的实用性和商业价值,必须对模型进行优化,确保其在高并发的生产环境下仍能保持稳定的性能。

书中还介绍了几种主流的模型部署方式,如云服务平台部署、边缘计算部署等。对于大规模应用,使用云计算平台进行集中化管理是一种常见的选择。通过在云端进行模型的批量推理,可以实现资源的最大化利用,并能随时根据需求进行弹性扩展。同时,刘聪还提出了模型压缩、知识蒸馏等技术,帮助减少部署成本并提高响应速度。

此外,本书还强调了数据隐私和安全性在模型部署中的重要性。随着人工智能技术的广泛应用,数据的安全性和隐私保护成为了企业和用户日益关注的问题。刘聪建议,开发者在部署大型语言模型时,应当遵循GDPR等数据隐私保护规范,并采取加密传输、隐私保护技术等手段,确保用户数据不被滥用。

4、大型语言模型的未来发展趋势

在《大型语言模型实战指南》的最后部分,刘聪对未来的大型语言模型发展趋势进行了展望。他认为,未来大型语言模型将更加智能化和多样化,不仅仅局限于文本处理,还将进一步拓展到图像、视频、音频等多模态数据的处理领域。通过跨模态学习,未来的模型可以同时理解并生成不同类型的数据,极大地丰富了人工智能的应用场景。

此外,刘聪还提到,大型语言模型将趋向于更高效、更绿色的方向发展。随着计算资源的不断增加,开发者将不再仅仅关注模型的精度,还会更加重视模型的能效和环境影响。如何减少模型训练和推理所消耗的能量,降低计算成本,将是未来研究的重要方向。

最后,刘聪强调了人工智能技术与伦理道德之间的平衡问题。随着技术的不断进步,如何确保语言模型在处理敏感话题时不产生偏见、不伤害个人隐私,已经成为AI开发者和政策制定者亟待解决的问题。未来,人工智能的伦理框架将成为技术发展的重要组成部分。

总结:

《大型语言模型实战指南:应用实践与场景落地》是一本极具价值的技术书籍,对于开发者、工程师以及AI技术爱好者来说,具有重要的参考意义。书中不仅详细介绍了大型语言模型的技术原理和应用场景,还深入探讨了模型部署和未来发展趋势,帮助读者全面理解并掌握这一前沿技术。通过本书的学习,读者可以获得应用大型语言模型解决实际问题的能力,提升自己的技术水平。

总之,刘聪的这本书为我们提供了一个关于大型语言模型从理论到实践的全方位指南,是人工智能领域不可或缺的必读之作。无论是初学者还是资深开发者,都能从中找到自己需要的知识和经验。

本文由nayona.cn整理

点击联系需要东西方神秘学学习资料,专业的咨询

有需要联系v;hx-hx3 有需要联系v;hx-hx3 有需要联系v;hx-hx3如果对你有一点点帮助,欢迎打赏~~~  
图片1

联系我们

图片2

关注公众号

打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
雅书雅书
上一篇 2024年11月11日 下午10:51
下一篇 2024年11月11日 下午10:53

相关推荐

同行购买网站记得加这个v;hx-hx3