《大模型RAG实战:RAG原理、应用与系统构建》汪鹏【文字版_PDF电子书_】
![]()
| 书名:大模型RAG实战 作者:汪鹏/谷清水/卞龙鹏 出版社:机械工业出版社 译者:无 出版日期:2024-9-15 页数:203 ISBN:9787111761990 | 6.4 豆瓣评分 | 孔网购买 | 点击喜欢 | 全网资源sm.nayona.cn |
内容简介:
这是一本全面讲解RAG技术原理、实战应用与系统构建的着作。作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。无论你是深度学习初学者,还是希望提升RAG应用技能的开发者,本书都将为你提供宝贵的参考与指导。
通过阅读本书,你将掌握以下知识:
- 透彻理解RAG的召回和生成模块算法
- 高级RAG系统的技巧
- RAG系统的各种训练方式方法
- 深入了解RAG的范式变迁
- 实战0基础搭建RAG系统
- 实战高级RAG系统微调与流程搭建
作者简介:
汪鹏
资深NLP技术专家和AI技术专家,拥有多年NLP落地经验。擅长结合用户场景,针对性地设计图谱、问答、检索、多模态、AIGC等相关的算法和落地方案。在Kaggle获得多枚奖牌,等级master。拥有公众号“NLP前沿”。
谷清水
毕业于清华大学,有国内多家大厂工作经历,7年深度学习项目开发经验。在KDD-CUP等机器学习竞赛中多次获奖,持有多项发明专利。知乎ID:“战士金”。
卞龙鹏
某上市公司资深AI算法工程师,多年互联网一线工作经验,10年机器学习与数据挖掘经验。持多项发明专利,发表多篇SCI文章,主攻机器视觉、模式识别、自然语言处理。
目 录:
前 言
第一部分 基础
第1章 RAG与大模型应用 2
1.1 大模型应用的方向:RAG2
1.1.1 什么是RAG2
1.1.2 RAG与模型微调的对比5
1.1.3 RAG带来的范式改变5
1.2 为什么需要RAG6
1.2.1 大模型的知识更新问题6
1.2.2 大模型生成结果的不可解释性问题8
1.2.3 大模型的数据泄露问题8
1.2.4 大模型的训练成本问题9
1.3 RAG的工作流程9
1.3.1 数据准备10
1.3.2 数据召回11
1.3.3 答案生成12
1.4 RAG的优缺点12
1.4.1 RAG的优点12
1.4.2 RAG的缺点13
1.5 RAG的使用场景14
1.6 RAG面临的挑战16
1.6.1 LLM的伸缩法则与知识库大小的关系16
1.6.2 相似度搜索的性能问题17
1.7 本章小结19
第2章 语言模型基础 20
2.1 Transformer20
2.1.1 词嵌入24
2.1.2 编码器35
2.1.3 解码器39
2.1.4 解码头41
2.2 自动编码器41
2.2.1 ELMo42
2.2.2 BERT43
2.3 自回归模型47
2.3.1 GPT48
2.3.2 LLaMA53
2.4 本章小结56
第3章 文本召回模型 58
3.1 文本召回模型基础58
3.2 稠密向量检索模型61
3.2.1 SimCSE61
3.2.2 SBERT63
3.2.3 CoSENT64
3.2.4 WhiteBERT65
3.2.5 SGPT66
3.3 稀疏向量检索模型67
3.3.1 朴素词袋模型67
3.3.2 TF-IDF68
3.3.3 BM2570
3.4 重排序模型71
3.5 本章小结72
第二部分 原理
第4章 RAG核心技术与优化方法 74
4.1 提示词工程74
4.1.1 提示词工程基础74
4.1.2 RAG场景下的提示词设计81
4.2 文本切块83
4.2.1 固定大小文本切块84
4.2.2 基于NLTK的文本切块85
4.2.3 特殊格式文本切块85
4.2.4 基于深度学习模型的文本切块86
4.3 向量数据库87
4.3.1 Faiss88
4.3.2 Milvus92
4.3.3 Weaviate93
4.3.4 Chroma93
4.3.5 Qdrant93
4.4 召回环节优化94
4.4.1 短文本全局信息增强94
4.4.2 召回内容上下文扩充95
4.4.3 文本多向量表示96
4.4.4 查询内容优化98
4.4.5 召回文本重排序101
4.4.6 多检索器融合102
4.4.7 结合元数据召回104
4.5 效果评估107
4.5.1 召回环节评估107
4.5.2 模型回答评估109
4.6 LLM能力优化115
4.6.1 LLM微调115
4.6.2 FLARE117
4.6.3 Self-RAG119
4.7 本章小结120
第5章 RAG范式演变 121
5.1 基础RAG系统121
5.1.1 基础流程121
5.1.2 存在的问题122
5.2 先进RAG系统125
5.3 大模型主导的RAG系统127
5.4 多模态RAG系统131
5.5 本章小结135
第6章 RAG系统训练 136
6.1 RAG系统的训练难点136
6.2 训练方法138
6.3 独立训练138
6.4 序贯训练139
6.4.1 冻结召回模块140
6.4.2 冻结生成模块141
6.5 联合训练143
6.5.1 异步更新索引143
6.5.2 批近似147
6.6 本章小结149
第三部分 实战
第7章 基于LangChain实现RAG应用 152
7.1 LangChain基础模块152
7.2 基于LangChain实现RAG156
7.3 基于Streamlit搭建一个ChatPDF可视化应用158
7.4 本章小结161
第8章 RAG系统构建与微调实战 162
8.1 向量模型构建162
8.1.1 模型选型162
8.1.2 训练数据构造163
8.1.3 向量模型训练166
8.1.4 向量模型联合训练167
8.2 大模型指令微调175
8.3 复杂问题处理179
8.3.1 微调数据构造180
8.3.2 微调数据处理194
8.3.3 复杂问题推理处理200
8.4 本章小结203
浏览器不支持脚本!
摘要:《大模型RAG实战:RAG原理、应用与系统构建》由汪鹏编著,书中详细探讨了基于大模型的RAG(Retriever-augmented Generation)技术,涵盖了其基本原理、实际应用以及如何构建相应的系统。通过对RAG的深入分析,汪鹏不仅阐述了RAG的核心机制,还讲解了如何将其应用于具体场景,并提供了构建RAG系统的详细步骤。这本书不仅适合深度学习和自然语言处理领域的研究者,也对技术从业者和工程师具有重要的参考价值。在本文中,我们将从RAG的基本原理、应用场景、技术实现与挑战以及系统构建四个方面,对这本书的核心内容进行详细解析。
1、RAG的基本原理
RAG技术的核心是结合检索和生成的能力,通过增强生成模型的上下文理解,使其能够在复杂任务中取得更好的表现。RAG通过引入外部检索模块,使得生成模型能够在处理输入时,依赖于检索到的相关信息,从而减少了对大规模训练数据的依赖,并有效提升了模型的推理能力和回答的准确性。
具体来说,RAG系统首先通过检索器获取与输入相关的外部知识,随后将这些检索到的信息与输入一起传递给生成模型。生成模型在此基础上生成最终的输出。与传统的生成模型不同,RAG能动态调用外部知识库中的信息,从而提升了模型的答案质量和可解释性。
汪鹏在书中详细描述了RAG原理的数学背景和推理过程,通过实例分析了如何将检索与生成结合,进一步提升模型的性能。他还强调了RAG相较于其他增强生成技术,如GPT-3等大模型的优势,特别是在复杂知识的处理上。
2、RAG的应用场景
RAG技术的应用范围非常广泛,特别是在自然语言处理领域。汪鹏在书中列举了多个实际应用场景,如问答系统、对话系统以及知识提取等。通过引入检索机制,RAG使得系统能够回答更加精准且富有背景知识的问题,从而提升了用户体验。
例如,在问答系统中,RAG通过检索模块获取相关文档或资料,将其信息传递给生成模型,从而生成更为精准的答案。这种方式尤其适用于需要依赖大量外部知识库的任务,如医学、法律等领域的专业问答。
此外,RAG还在对话系统中表现出色,能够根据用户输入的内容检索并生成更符合语境的回应。通过集成检索与生成能力,RAG不仅能够理解复杂的问题背景,还能灵活地提供个性化的回答,极大地提升了对话的自然性与智能性。
3、RAG的技术实现与挑战
尽管RAG在多个应用中展现了强大的能力,但其技术实现仍然面临一些挑战。首先,检索模块的效率和准确性是RAG系统中的关键因素。如何设计一个高效且准确的检索器,能够在大量数据中快速找到相关信息,成为构建高性能RAG系统的首要问题。
此外,生成模型与检索模块之间的协同工作也是一个技术难题。如何让生成模型在得到检索结果后,能够准确地融合这些信息,并生成流畅且自然的回答,是RAG系统设计中的一大挑战。汪鹏在书中详细探讨了如何优化生成模型的输入输出流程,提升两者的协同效应。
最后,RAG系统的可扩展性和灵活性也是值得关注的问题。随着数据量和知识库的增大,如何保持系统的高效性,并使得其能够适应不同领域的需求,依然是技术开发者需要攻克的难题。
4、RAG系统的构建方法
书中还特别讲解了RAG系统的构建过程,从数据收集、检索模块设计到生成模型的训练与优化,汪鹏提供了详细的步骤和技术细节。首先,构建一个RAG系统需要收集大量的外部知识库,并根据任务需求进行合理的筛选与预处理。
其次,在检索模块的设计上,汪鹏推荐使用基于稀疏向量或密集向量的检索方法,如FAISS、BM25等技术,以提高检索的效率与准确性。在生成模型的训练方面,书中详细讲解了如何使用预训练模型,如BERT、T5等,进行微调,以便更好地融合外部信息。
最后,系统的性能调优和部署也是构建RAG系统中不可忽视的一部分。汪鹏强调,在实际应用中,模型的推理速度和资源消耗是关键因素,如何优化计算过程并实现实时响应,成为系统部署阶段的重要任务。
总结:
《大模型RAG实战:RAG原理、应用与系统构建》深入剖析了RAG技术的各个方面,涵盖了从原理、应用到实际构建的全过程,为读者提供了全面的技术视角与实践指南。通过汪鹏的细致讲解,读者不仅能够掌握RAG的基本知识,还能深入了解如何将其应用于具体项目,并解决其中的技术难题。
这本书对于从事自然语言处理和深度学习的研究人员以及工程师而言,具有极高的参考价值。无论是在理论的探讨,还是实际系统的搭建,汪鹏都给出了实用的建议和指导,对于推动RAG技术的普及与应用具有重要意义。
本文由nayona.cn整理
联系我们

关注公众号

微信扫一扫
支付宝扫一扫 