《大嘴巴漫谈数据挖掘(全彩)》从最基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及常用算法。其中每一种数据挖掘算法都辅以通俗易懂的实例,读者能够在直观性、趣味性中学习算法的具体流程,明白算法的实现过程。通过《大嘴巴漫谈数据挖掘(全彩)》的学习,读者可以对数据挖掘的概念、应用和算法技术有一个清晰的理解和认识,并可以熟悉相关统计学的基本原理。
《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。
目录
第一境昨夜西风凋碧树。独上高楼,望尽天涯路…… /10
1.1数据挖掘简介 / 11
开篇点题引五问 /12
大数据中求价值 /13
定义概述归特点 /14
知识决策跨领域 /15
架构特征多形式 /17
数据立方展多维 /19
功能挖掘四大类 /22
分类刻画类标识 /23
数据聚类辨亲疏 /24
预测未来训模型 /25
关联源自购物篮 /27
模型过程方法论 /28
十大算法成经典 /32
1.2数据挖掘应用 /33
行业推广多应用 /34
用户为王放心中 /36
指导运营全周期 /37
定位目标寻用户 /38
精准营销成闭环 /39
交叉产品有关联 /40
细分用户刻画像 /41
用户体验模型化 /43
指标评测建体系 /44
流失预警保用户 /45
跟踪评估验效果 /47
第二境衣带渐宽终不悔,为伊消得人憔悴…… /48
2.1概率定义 /49
浮生难料尽偶然 /50
一枚硬币抛正反 /51
引出随机小试验 /53
样本空间样本点 /54
事件三分包万象 /55
试验频率需频繁 /58
次数无限值极限 /59
描述概率定特点 /60
古典概型等可能 /61
事件B后A在前 /62
求出概率称条件 /65
独立事件A和B /67
抽签中奖公平性 /71
常用概率两公式 /76
交空并全划样本 /77
综合状态全概率 /78
前因后果贝叶斯 /80
2.2随机变量 /81
随机试验数量化 /82
统计规律双类型 /83
离散变量分布律 /84
硬币抛掷是一零 /85
分布函数连续型 /87
函数求导得密度 /89
高斯分布称正态 /91
标准正态分位点 /95
2.3数字特征 / 98
随机变量有特征 /98
平均取值是期望 /100
方差衡量偏离值 /101
标准开根同量纲 /103
变量关系协方差 /104
相关系数相关度 /105
研究总体要抽样 /108
抽样分布统计量 /109
2.4参数估计 /111
最小二乘估参数 /112
极大似然大概率 /116
区间估计置信度 /119
2.5假设检验 / 123
总体假设来检验 /124
服从正态抽样本 /125
统计量中验假设 /126
弃真取伪两错误 /127
显著检验小概率 /128
小概率中拒绝域 /130
检验流程出决策 /131
已知总体方差值 /132
检验中验均值 /133
第三境众里寻她千百度,蓦然回首,那人却在,灯火阑珊处。 /134
3.1关联规则 / 135
购物篮中找关联 /136
数据事务若干项 /137
事务空间含项集 /138
置信支持提升度 /142
规则源于频繁项 /145
k项连接和剪枝 /146
生成非空规则集 /148
关联效果来评估 /149
3.2决策树 /155
决策思维成树形 /156
分类预测工作流 /161
原理基于信息熵 /162
信息增益条件熵 /164
节点拆分选特征 /170
3.3贝叶斯 /186
预测分类贝叶斯 /187
类别概率要最大 /188
分类数据新预测 /195
3.4聚类分析 / 196
物以类聚人以群 /197
样本变量定矩阵 /198
R型Q型换空间 /199
距离度量相似度 /200
系数聚类统计量 /202
标准样本选欧氏 /203
层次聚合归大类 /205
3.5神经网络 /209
神经网络神经元 /210
神经元中有加权 /211
输入映射输出层 /213
求出误差调参数 /214
权重偏置学习率 /216
实例分析模型流 /217
3.6线性回归 /222
研究身高引回归 /223
单自变量归一元 /224
最小二乘估回归 /226
数据差异总离差 /228
分为解释和误差 /229
判定系数拟合度 /230
多元回归建方程 /231
回归面中展二元 /233
求得回归系数解 /234
衡量拟合验效果 /236
3.7逻辑回归 /237
因变量中二分类 /238
二项逻辑回归式 /240
极大似然解方程 /242
预测分类符合率 /244
3.8因子分析 /245
相关变量纳因子 /246
因子构造筑模型 /248
因子载荷统计性 /251
衡量信息共同度 /252
方差贡献重要性 /253
因子分析四步曲 /254
构造因子求载荷 /255
旋转因子得命名 /260
因子组合求得分 /265
3.9信度分析 /268
设计问卷来调研 /269
信度检验可靠性 /270
3.10效度分析 /272
结构方程协方差 /273
测量模型内外生 /276
结构模型潜变量 /279
效度分析路径图 /280
提出假设依理论 /281
固定负荷识模型 /282
相关阵中估参数 /283
《你不理财 财不理你(2)》内容简介:钱是需要去赚的,通常情况下,只要你能赚,你的财富才会越来越多,但同时也是省下来的。很多
《人生天地间 忽如远行客》内容简介:本书是当代知名作家张贤亮的散文集,包含“近乡情更怯”“天涯若比邻”“繁华的荒凉”“关于时
《翻转世界》内容简介:《翻转世界》的作者尼克·比尔顿身兼《纽约时报》研究与发展实验室研究员与专栏作家等职,通过不断尝试各种
清晰、透彻和严谨是本书与其他数字通信教材的显著区别。本书由国际公认的专家和屡获殊荣的学者编写,是数字通信领域的基础性教材
MATLAB之父:编程实践-(中译本) 本书特色 《matlab之父:编程实践》一书是matlab之父cleve moler的*新力作。作者通过20个有趣的主题...
WPF领域圣经级著作目录 第一部分 背景第1章 为什么创造WPF第2章 XAML揭秘第3章 WPF的重要新概念第二部分 构建WPF应用程序第
《PWA实战:面向下一代的Progressive Web APP》内容简介:Progressive Web App(PWA)是由谷歌提出的一整套技术解决方案,它...
MarkRichards是一位造诣颇深的作者和会议演讲者,他是金融服务行业的实战型SOA和企业体系结构师。除了发表大量文章之外,他还是《
《演说思维:阿里演说内训课》内容简介:本书首开先河,凝练IP思维、有我思维、定位思维、链接思维等12大演说思维,融汇心理学、神
&ArcGIS开发宝典从入门到精通 内容简介 本书是为适应当前我国ArcGIS应用开发需要而编写的一本而向不同层次的开发指导教程。本书全面系统地介绍了ArcGI...
跟阿铭学Linux-(第3版) 本书特色 本书是一本入门级的Linux学习教材,适合初学者阅读。本教程由浅入深,内容精湛,案例丰富,通俗易懂!书中分两部分:前面...
登月是一场骗局?南北半球浴室里水流的漩涡真的不同吗?只有在春分那一天才能竖起鸡蛋?真的有人看到过UFO或外星人吗?陨星会落在
《Web应变之道》基于Web实战经验、规范组织及社区论坛,分析Web现状、问题和挑战,紧扣Web的变化性与不确定性,提供方法论的指导
这是一本关于sqlite起源、特性、简介、使用、深度解析的书。《sqlite权威指南(第二版)》首先从sqlite最初起源、特性、设计理念
内容简介:作为服务器端的JavaScript解释器,Node是一个轻量高效的开发平台,用于构建响应快速、高度可扩展的Web应用。它使用事件
生物群智计算与机器学习 本书特色 作为人工智能领域的一个重要分支,生物群智计算与机器学习已经引起越来越多**外研究者的关注,成为前沿性的热点研究领域,在理论和应...
《像我这样的一个读者》内容简介:独一无二的经典文学作品阅读指南,世界华文文学奖得主西西的私人书单。打开这本无限之书,你可以
《浪花礼赞:汪氏现当代名人录》内容简介:本书主要辑录了现当代为国家建功立业而呕心沥血、殚精竭虑、鞠躬尽瘁、忠心耿耿、赤胆忠
Spring Framework2入门经典 本书特色 使用Java Enterprise Edition开发服务器端的应用程序町能会非常复杂费时。Spring...
本书从为什么学习程序设计语言入手,深入细致地讲解了命令式语言的主要结构及其设计与实现,内容涉及变量、数据类型、表达式和赋