薛薇博士编著的这本《基于r的统计分析与数据挖掘》聚焦当今备受国内外数据分析师和数据应用者关注的r语言,企图借助r实现统计分析和数据挖掘。理由很简单:r不仅囊括了几乎所有的经典统计方法,而且拥有众多前沿的现代统计模型、数据挖掘算法以及**的绘图功能;不仅可以解决数据分析的共性问题,而且能够服务于电商、金融、医学、生物、地理、环境、传媒等领域的特色数据应用;不仅适合统计分析的学习者、学术研究的探索者,而且适合致力数据应用开发的实践者和掘金者。
薛薇博士编著的这本《基于r的统计分析与数据 挖掘》聚焦当今备受国内外数据分析师和数据应用者 关注的r语言,关注如何借助r实现统计分析和数据挖 掘。它既不是仅侧重理论讲解的统计分析和数据挖掘 教科书,也不是仅侧重r编程操作的使用手册,而是 以数据分析贯穿全书的两者的有机结合。本书特色在于:以数据模拟的直观方式论述方法 原理的同时,通过案例强化r的操作实践性;在以解 决应用问题为目标讨论r操作的同时,通过原理论述 强化模型结果的解读理解。《基于r的统计分析与数据挖掘》定位于统计分 析和数据挖掘的学习者、实践者和研究者,旨在使读 者理解统计分析原理,熟练操控r软件,拓展数据应 用,提升研究水平。
第1章关于r1.1为什么选择r1.2如何学习r1.3r入门**1.4小结第2章r的数据组织2.1r的数据对象2.2创建和访问r的数据对象2.3从文本文件读数据2.4外部数据的导入2.5r数据组织的其他问题2.6小结第3章r的数据管理3.1数据合并3.2数据排序3.3缺失数据报告3.4变量计算3.5变量值的重编码3.6数据筛选3.7数据保存3.8数据管理中控制流程3.9小结第4章r的基本数据分析:描述和相关4.1数值型单变量的描述4.2分类型单变量的描述4.3两数值型变量相关性的分析4.4两分类型变量相关性的分析4.5小结第5章r的基本数据分析:可视化5.1绘图基础5.2数值型单变量分布的可视化5.3分类型变量分布和相关性的可视化5.4两数值型变量相关性的可视化5.5lattice绘图5.6小结第6章r的两均值比较检验6.1两独立样本的均值检验6.2两配对样本的均值检验6.3样本均值检验的功效分析6.4两总体分布差异的非参数检验6.5两样本均值差的置换检验6.6两样本均值差的自举法检验6.7小结第7章r的方差分析7.1单因素方差分析7.2单因素协方差分析7.3多因素方差分析7.4小结第8章r的回归分析:一般线性模型8.1回归分析概述8.2建立线性回归模型8.3线性回归方程的检验8.4回归诊断:误差项是否满足高斯马尔科夫假定8.5回归诊断:诊断数据中的异常观测点8.6回归诊断:多重共线性的诊断8.7回归建模策略8.8回归模型验证8.9带虚拟变量的线性回归分析8.10小结第9章r的回归分析:广义线性模型9.1广义线性模型概述9.2logistic回归分析:连接函数和参数估计9.3logistic回归分析:解读模型和模型检验9.4logistic回归分析:r函数和示例9.5logistic回归分析:回归诊断9.6泊松回归分析9.7广义线性模型的交叉验证9.8小结第10章r的聚类分析10.1聚类分析概述10.2k-means聚类10.3层次聚类10.4两步聚类10.5小结第11章r的因子分析:变量降维11.1因子分析概述11.2构造因子变量:基于主成分分析法11.3构造因子变量:基于主轴因子法11.4因子变量的命名11.5计算因子得分11.6小结第12章r的线性判别分析:分类模型12.1距离判别12.2fisher判别12.3小结第13章r的决策树:预测模型13.1决策树算法概述13.2分类回归树的生长过程13.3分类回归树的剪枝13.4建立分类回归树的r函数和示例13.5建立分类回归树的组合预测模型13.6随机森林13.7小结第14章r的人工神经网络:预测和聚类14.1人工神经网络概述14.2b-p反向传播网络14.3b-p反向传播网络的r函数和示例14.4som自组织映射网络14.5小结
薛薇,工学硕士、经济学博士,中国人民大学统计学院副教授,教育部人文社会科学重点研究基地:中国人民大学应用统计学科研究中心副主任。关注数据挖掘及统计分析方法,统计和数据挖掘软件应用,统计数据库系统研发等方面,涉足网络新媒体传播和互动模式建模、政府和官方微博分析、学科学术热点跟踪等文本挖掘和统计应用领域,以及以数据挖掘为依托的客户关系管理等。主要代表作:《SPSS统计分析方法及应用》、《Clementine数据挖掘方法及应用》、《基于信息技术的统计信息系统》。
《2020年法律硕士联考重要法条释解》内容简介:本书主要内容为法律硕士联考法条类图书,针对法条涵盖的考点,分析和讲解,包含5科,
结构动力分析的MATLAB实现 本书特色 本书系统介绍了各类结构动力问题进行分析求解,如:线性结构的动力分析,非线性结构的动力分析,频域内结构动力分析,simu...
《园区网络架构与技术》内容简介:本书以园区网络所面临的业务挑战为切入点,详细介绍了智简园区网络的架构与技术,旨在向读者全面
《分配正义新论:人道与公平》内容简介:当今的分配正义理论主要是义务论的。这种义务论分配正义理论一方面或多或少受到康德伦理思
《孟子选注》内容简介:本书从战国时期思想家、政治家、教育家孟子的哲学政治理论和教育纲领著作《孟子》七篇中选取精华篇章,加以
《3分钟,让公司介绍发光》内容简介:本书聚焦公司介绍的书写和展示,力争实现:用3分钟的介绍,让客户选择,被客户信任,达成合作
《图形数据可视化》内容简介:本书主要探讨理解图形数据、建立图形数据结构以及创建有意义的可视化的方法。书中通过精彩的实例分析
金蝶ERP:K/3标准财务培训教程(11.X版) 本书特色 本书对金蝶ERP-K/3 V11.0标准财务系统模块进行了详细讲解,同时辅以大量实例,读者可以轻松、...
《它们的性》内容简介:这是一本姿势搞笑、观点硬核的人文科普。洗刷三观,颠覆常识! 丰富多彩的动物世界,与人类世界何其相似,又
《跨界战争——商业重组与社会巨变》内容简介:本书是一本适合于大众阅读的经济类科普读物。作者以朴素而敏锐的眼光观察问题,以简
《中国式价值投资(修订版)》内容简介:2009年6月,李驰在北京见到索罗斯,提出了一个思索很久的问题:能不能既做巴菲特,又做索罗
群体智能是近年来发展迅速的人工智能学科领域.通过研究分散,自组织的动物群体和人类社会的智能行为,学者们提出了许多迥异于传统思
书由浅入深,全面、系统地介绍了Node.js开发技术。书中提供了大量有针对性的实例,供读者实践学习,同时提供了大量的实践练习题及
众所周知,视觉营销从业者在零售业界正发挥着日益重要的影响力。无论是对商家在产品销售及陈列展示上的辅助与指导,还是在推进当
Photoshop CC自学魔法书-(附光盘) 本书特色 《Photoshop CC自学魔法书》为Photoshop初学者量身打造,是入门级读者快速、全面掌握P...
《“倭寇”与明代的东亚秩序(精)》内容简介:本书主要从东亚区域社会的视角,在借鉴前人研究成果的基础上,通过对中、日、韩三国
易飞、余刚、何凌、朱威编著的这本《GPRS网络信令实例详解》系统而全面地介绍了GPRS网络的系统架构以及以信令为主线的各接口协议
《APP营销实战:抢占移动互联网第一入口》内容简介:在移动互联网时代,谁先占领用户的手机桌面,谁就是“明日霸主”。可以说,APP
《经济法基础》内容简介:本书旨在帮助广大读者进行2015年会计专业技术资格考试的复习备考,其主要功能在于帮助读者准确把握考试重
Excel 2007实战技巧精粹-(附光盘) 本书特色 用数据说话《excel实战技巧精粹》,2007年上市,至今销售60000册《excel应用大全》,200...