《Python数据分析与挖掘实战》翟世臣;张良均 主编;张奥多;花强;周东平 副主编【文字版_PDF电子书_】

| 书名:Python数据分析与挖掘实战 作者:翟世臣 等 出版社:人民邮电出版社 译者:无 出版日期:2022-10-01 页数:292 ISBN:9787115575821 | 0.0 豆瓣评分 | 孔网购买 | 点击喜欢 | 全网资源sm.nayona.cn |
内容简介:
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预测、电视产品个性化推荐,以及基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测。本书大部分章节包含实训和课后习题,通过练习和操作实践,可帮助读者巩固所学的内容。
本书可作为“1 X”证书制度试点工作中的大数据应用开发(Python)职业技能等级(高级)证书的教学和培训用书,也可作为高校数据科学或人工智能相关专业的教材,还可作为数据挖掘爱好者的自学用书。
作者简介:
翟世臣,男,安徽信息工程学院,企业级开发技术讲师,不错工程师, 中国科学技术大学软件工程硕士 南京航空航天大学在读博士 研究方向:机器学习,数据分析与可视化,知识图谱 授课方向: Java EE,python,mysql,软件工程导论,人工智能导论 获奖情况:校级靠前教师,校级青年教师技能大赛一等奖,指导学生竞赛省级一等奖与重量二等奖等多项很好指导老师。
目 录:
基础篇
第1章 数据挖掘基础 1
1.1 数据挖掘发展史 1
1.2 数据挖掘的常用方法 2
1.3 数据挖掘的通用流程 2
1.3.1 目标分析 2
1.3.2 数据抽取 2
1.3.3 数据探索 3
1.3.4 数据预处理 3
1.3.5 分析与建模 4
1.3.6 模型评价 4
1.4 常用数据挖掘工具 4
1.5 Python数据挖掘环境配置 5
小结 7
课后习题 7
第2章 Python数据挖掘编程基础 9
2.1 Python使用入门 9
2.1.1 基本命令 9
2.1.2 判断与循环 12
2.1.3 函数 13
2.1.4 库的导入与添加 15
2.2 Python数据分析预处理的常用库 17
2.2.1 NumPy 17
2.2.2 pandas 17
2.2.3 Matplotlib 18
2.3 Python数据挖掘建模的常用库和框架 18
2.3.1 scikit-learn 18
2.3.2 深度学习框架 19
2.3.3 其他 21
小结 22
实训 判断、函数、类型转换的使用 22
课后习题 23
第3章 数据探索 24
3.1 数据校验 24
3.1.1 一致性校验 24
3.1.2 缺失值校验 27
3.1.3 异常值校验 29
3.2 数据特征分析 33
3.2.1 描述性统计分析 33
3.2.2 分布分析 36
3.2.3 对比分析 40
3.2.4 周期性分析 43
3.2.5 贡献度分析 44
3.2.6 相关性分析 45
小结 48
实训 48
实训1 分布分析、描述性统计分析和贡献度分析 48
实训2 对比分析、相关性分析和周期性分析 49
课后习题 50
第4章 数据预处理 52
4.1 数据清洗 52
4.1.1 重复值处理 52
4.1.2 缺失值处理 55
4.1.3 异常值处理 57
4.2 数据变换 58
4.2.1 简单函数变换 58
4.2.2 数据标准化 58
4.2.3 数据离散化 61
4.2.4 独热编码 63
4.3 数据合并 65
4.3.1 多表合并 65
4.3.2 分组聚合 72
小结 80
实训 80
实训1 数据清洗 80
实训2 数据变换 82
实训3 数据合并 82
课后习题 82
第5章 数据挖掘算法基础 84
5.1 分类与回归 84
5.1.1 常用的分类与回归算法 84
5.1.2 分类与回归模型评价 85
5.1.3 线性模型 89
5.1.4 决策树 93
5.1.5 最近邻分类 97
5.1.6 支持向量机 99
5.1.7 神经网络 101
5.1.8 集成算法 107
5.2 聚类 112
5.2.1 常用的聚类算法 112
5.2.2 聚类模型评价 114
5.2.3 K-Means算法 115
5.2.4 密度聚类 120
5.2.5 层次聚类 123
5.3 关联规则 126
5.3.1 常用关联规则算法 126
5.3.2 Apriori算法 127
5.4 智能推荐 131
5.4.1 常用智能推荐算法 131
5.4.2 智能推荐模型评价 132
5.4.3 协同过滤推荐算法 133
5.4.4 基于流行度的推荐算法 138
5.5 时间序列 139
5.5.1 时间序列算法 140
5.5.2 时间序列的预处理 140
5.5.3 平稳序列分析 142
5.5.4 非平稳序列分析 144
实训 152
实训1 使用分类算法实现客户流失预测 152
实训2 使用K-Means聚类算法实现超市顾客聚类分析 152
实训3 使用Apriori算法挖掘网址间的相关关系 153
实训4 使用协同过滤推荐算法实现对用户进行品牌的个性化推荐 153
实训5 使用ARIMA算法实现气温预测 154
课后习题 155
实战篇
第6章 信用卡高风险客户识别 158
6.1 背景与目标 158
6.1.1 背景 158
6.1.2 数据说明 159
6.1.3 目标 160
6.2 数据探索 161
6.2.1 描述性统计分析 161
6.2.2 客户历史信用记录 162
6.2.3 客户经济情况 164
6.2.4 客户经济风险情况 166
6.3 数据预处理 169
6.3.1 数据清洗 169
6.3.2 属性构造 171
6.4 分析与建模 174
6.4.1 参数寻优 174
6.4.2 构建聚类模型 176
6.4.3 信用卡客户风险分析 176
6.5 模型评价 179
小结 180
实训 使用K-Means聚类算法实现运营商客户价值分析 180
课后习题 181
第7章 餐饮企业菜品关联分析 182
7.1 背景与目标 182
7.1.1 背景 182
7.1.2 数据说明 183
7.1.3 目标 185
7.2 数据探索 185
7.2.1 分析每日用餐人数和营业额 185
7.2.2 分析菜品热销度 187
7.3 数据预处理 189
7.3.1 数据清洗 189
7.3.2 属性构造 190
7.4 分析与建模 191
7.4.1 构建Apriori模型 191
7.4.2 训练模型 193
7.5 模型评价 194
小结 196
实训 西饼屋订单关联分析 197
课后习题 197
第8章 金融服务机构资金流量预测 198
8.1 背景与目标 198
8.1.1 背景 198
8.1.2 数据说明 199
8.1.3 目标 200
8.2 数据预处理 201
8.2.1 属性构造 201
8.2.2 截取平稳部分数据 202
8.2.3 周期性差分 204
8.2.4 平稳性检验和白噪声检验 205
8.3 分析与建模 205
8.3.1 时间序列模型的定阶 205
8.3.2 模型检验 206
8.4 模型评价 207
小结 209
实训 构建ARIMA模型预测资金赎回数据 210
课后习题 210
第9章 O2O优惠券使用预测 211
9.1 背景与目标 211
9.1.1 背景 211
9.1.2 数据说明 212
9.1.3 目标 212
9.2 数据探索 213
9.2.1 描述性统计分析 213
9.2.2 分析优惠形式信息 215
9.2.3 分析用户消费行为信息 216
9.2.4 分析商户投放优惠券信息 218
9.3 数据预处理 221
9.3.1 数据清洗 221
9.3.2 数据变换 222
9.4 分析与建模 225
9.4.1 决策树分类模型 225
9.4.2 梯度提升分类模型 227
9.4.3 XGBoost分类模型 228
9.5 模型评价 229
小结 232
实训 运营商客户流失预测 232
课后习题 233
第10章 电视产品个性化推荐 235
10.1 背景与目标 235
10.1.1 背景 235
10.1.2 数据说明 236
10.1.3 目标 237
10.2 数据预处理 238
10.2.1 数据清洗 238
10.2.2 数据探索 241
10.2.3 属性构造 248
10.3 分析与建模 251
10.3.1 基于物品的协同过滤推荐模型 252
10.3.2 基于流行度的推荐模型 254
10.4 模型评价 255
小结 257
实训 网页浏览个性化推荐 257
课后习题 258
第11章 基于TipDM大数据挖掘建模平台实现金融服务机构资金流量预测 259
11.1 平台简介 259
11.1.1 实训库 261
11.1.2 数据连接 261
11.1.3 实训数据 261
11.1.4 我的实训 262
11.1.5 系统算法 262
11.1.6 个人算法 264
11.2 快速构建金融服务机构资金流量预测实训 265
11.2.1 数据源配置 266
11.2.2 属性构造 267
11.2.3 数据筛选 271
11.2.4 周期性差分 272
11.2.5 序列检验 274
11.2.6 分析与建模 276
小结 279
实训 构建ARIMA模型预测航空公司乘客量数据 279
课后习题 279
浏览器不支持脚本!
摘要:《Python数据分析与挖掘实战》由翟世臣、张良均担任主编,张奥多、花强、周东平担任副主编,全书围绕Python语言在数据分析、数据挖掘以及人工智能领域中的实际应用展开系统阐述。该书不仅重视理论知识的讲解,还强调实践能力的培养,通过大量案例与项目训练,帮助读者建立完整的数据分析思维。书中涵盖Python基础语法、数据处理工具、机器学习算法、可视化分析以及商业数据建模等内容,能够满足高校教学、职业培训以及企业实践等多方面需求。全书结构清晰,章节安排循序渐进,从基础操作到复杂建模均进行了深入讲解,使读者能够在真实场景中掌握数据分析技巧。与此同时,教材结合当前大数据时代的发展背景,体现出较强的时代性与应用价值,对于培养数据科学人才、推动数字化能力提升具有重要意义。
一、教材体系科学完整
《Python数据分析与挖掘实战》在整体结构设计上体现出较强的逻辑性与系统性。全书从Python基础环境搭建开始,逐步延伸至数据分析、机器学习以及数据挖掘项目实践,形成了层层递进的知识体系。对于初学者而言,这种编排方式能够有效降低学习门槛,使读者在掌握基础技能后逐渐进入更高层次的数据分析领域。
教材在章节安排方面注重知识衔接,每一个模块之间都具有明确的关联性。例如,在介绍数据处理之前,先系统讲解Python编程基础与常见库的使用方法,使读者能够理解后续分析工作的底层逻辑。随后再引入NumPy、Pandas等数据分析工具,让学习过程更加自然顺畅。
为了增强学习效果,书中还设置了大量案例分析与实践训练。不同于单纯的理论介绍,教材更加重视“学以致用”的理念,通过真实的数据案例帮助读者掌握分析方法。案例内容涉及商业、金融、电商、教育等多个领域,增强了教材的现实意义与行业价值。
教材还特别重视知识的综合应用能力培养。在完成单一知识点学习之后,往往会安排综合实训项目,使读者能够将前面所学内容进行整合。这种教学设计不仅提高了学习效率,也帮助读者建立完整的数据分析思维模式。
从整体来看,该教材兼顾理论深度与实践广度,不仅适合高校课堂教学,也适用于企业培训与职业技能提升。系统化的内容设计,使其成为当前Python数据分析领域中较具代表性的实战型教材之一。
二、数据分析实践突出
在数据分析教学方面,《Python数据分析与挖掘实战》表现出明显的实践导向特征。教材并未停留在简单的概念讲解层面,而是通过大量实例演示数据分析全过程,包括数据采集、清洗、整理、分析以及结果展示等多个环节。
书中对Pandas库的讲解尤为细致,通过实际案例说明数据表格处理、缺失值填充、重复值删除以及数据筛选等常见操作。这些内容与现实工作场景高度契合,使读者能够快速掌握企业级数据处理技能,提高实际应用能力。
在数据可视化部分,教材引入Matplotlib与Seaborn等常用工具,通过图表展示帮助读者理解数据背后的规律。折线图、柱状图、热力图以及散点图等可视化形式,不仅增强了分析结果的表达效果,也提高了数据解读的准确性。
教材还强调数据分析思维的重要性。除了教授操作方法之外,还会引导读者思考如何提出问题、如何选择分析模型以及如何解释数据结果。这种思维训练能够帮助学习者真正理解数据分析工作的本质,而不仅仅停留在工具使用层面。
随着大数据时代的发展,数据分析能力已经成为众多行业的重要技能。《Python数据分析与挖掘实战》通过丰富的案例与实践训练,使读者能够在学习过程中建立完整的数据处理流程意识,从而更好地适应未来数字化社会的发展需求。
三、机器学习内容深入
作为一本兼顾数据挖掘与人工智能实践的教材,《Python数据分析与挖掘实战》在机器学习内容方面同样具有较高水平。教材围绕分类、聚类、回归以及预测等核心算法展开讲解,使读者能够逐步理解机器学习的基本原理与应用场景。
书中详细介绍了常见的数据挖掘算法,例如决策树、K近邻算法、朴素贝叶斯以及支持向量机等内容。为了避免理论过于抽象,教材通常会结合具体案例进行演示,让读者能够直观理解算法运行机制与应用效果。
在实践操作层面,教材大量使用Scikit-learn库进行模型训练与预测分析。通过真实数据集演示模型构建过程,使读者能够掌握数据预处理、特征工程、模型训练以及结果评估等关键步骤,提升机器学习项目开发能力。
教材对于模型评价方法也进行了深入说明。例如准确率、召回率、F1值以及混淆矩阵等指标,都结合案例进行了详细分析。这种系统化的讲解方式,有助于读者建立科学的模型评价意识,提高数据挖掘工作的准确性。
当前人工智能技术正在快速发展,机器学习已经广泛应用于金融风控、智能推荐、市场预测以及智能制造等领域。《Python数据分析与挖掘实战》通过系统化教学,使学习者能够快速进入机器学习领域,为后续深入研究人工智能技术打下坚实基础。
四、教学应用价值显著
《Python数据分析与挖掘实战》不仅是一部专业教材,也是一部具有较强教学推广价值的实践指导书。教材内容紧贴高校教学需求,在知识结构、案例安排以及实践设计等方面均体现出明显的教学特色。
在课堂教学中,该教材能够帮助学生建立完整的数据分析知识框架。教师可以根据章节内容灵活安排理论讲授与实验操作,使学生在学习过程中形成较强的动手实践能力。这种“理论+实践”的教学模式,更符合当前应用型人才培养方向。
对于职业教育与技能培训而言,该教材同样具有较高参考价值。由于书中大量采用真实案例进行教学,因此学习者能够快速掌握企业工作中的数据处理方法,提高就业竞争力。尤其是在互联网、电商以及金融行业中,Python数据分析技能已经成为重要岗位能力。
教材还注重培养读者的问题解决能力。很多案例不仅提供代码实现过程,还会分析实际业务背景,引导学习者从业务需求出发寻找解决方案。这种思维方式对于未来从事数据科学工作具有重要意义。
随着数字经济快速发展,社会对于数据分析人才的需求持续增长。《Python数据分析与挖掘实战》凭借系统化内容、丰富案例以及实践导向优势,成为当前数据分析教育领域中具有较高影响力的专业教材之一,对于推动数字化人才培养发挥了积极作用。
总结:
《Python数据分析与挖掘实战》以系统化知识结构、丰富实践案例以及深入的数据挖掘内容,为读者构建了完整的数据分析学习体系。教材不仅强调Python技术本身,更重视数据分析思维与实际应用能力培养,使学习者能够真正掌握从数据处理到模型分析的完整流程。
在人工智能与大数据快速发展的背景下,该教材展现出较强的时代价值与教育意义。无论是高校教学、职业培训还是企业学习实践,都能够从中获得有效帮助。通过理论与实践相结合的教学模式,教材为培养高水平数据分析人才提供了重要支持,也为Python数据科学教育的发展注入了新的动力。
本文由nayona.cn整理
联系我们

关注公众号

微信扫一扫
支付宝扫一扫 