《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《我将前往的远方》内容简介:联合报文学大奖得主郭强生,《断代》后又一力作 “人生私散文”获奖作,献给单身初老族的一首情歌 难
《多学科视域中的MOOC研究》内容简介:《MOOCs:理论与实践》面向人才培养实践需求,将MOOCs学习、开发、运行与管理融为一体,不仅
本书将再造从地球上消失和绝迹的动物!恐龙-洪荒年代的神话;麋鹿-漂泊的中国精灵;始祖鸟-美化了的爬行动物;欧洲野马-欧罗
《时与光》内容简介:这是一部像推理小说一样“烧脑”的科学史话。跟随书中的一个个智者,你将从古典力学走向经典体系,最终跨入理
《四旋翼飞行器设计与实现》内容简介:本书从四旋翼飞行器的历史和现状切入,通过阐述无人机的飞行原理、系统构成、通信协议等,向
《改革开放口述史》内容简介:纪念改革开放四十周年万里、曾培炎、陈锦华等改革开放重大决策亲历者真情讲述。本书精选我国改革开放
《非正常军师联盟》内容简介:古人很潮系列书籍。继《唐朝有嘻哈》《宋朝好声音》《魏晋有美男》《奇葩王者说》《古人教你学吐槽》
《拼(下):冲出美国陷阱》内容简介:下册讲述鸿鹄技术在重装旅撤离的情况下,蒙冤不白的耿晔带领铁三角坚守西雅图,历尽艰辛通过
《物含妙理总堪寻 (理解科学丛书)》内容简介:本书来源于作者长期以来在北京师范大学开设的一个科普讲座“从爱因斯坦到霍金的宇宙
《零基础学C语言(第3版)》内容简介:单片机C51语言是目前最流行的单片机程序设计语言。本书由浅入深,循序渐进地讲解了C51语言的
《我们为什么要做企业家》内容简介:世界上生意人常有,真正的企业家属于“稀有动物”,但唯有企业家才能对企业和社会起到强大的引
《陈慕泽2020年管理类联考(MBA/MPA/MPAcc等)综合能力逻辑精选450题》内容简介:本书主要内容为管理类联考逻辑应试辅导用书,涉及
精通XNA图形与游戏程序设计 本书特色 作为一本介绍XNA游戏程序设计的书籍,杨关胜等编著的《精通XNA图形与游戏程序设计》把“实用”作为每一章节的出发点和落脚...
《装帧之美》由日本设计大师铃木成一亲自挑选在他长达近三十年的设计生涯、八千件的作品中,最具代表性的一百二十件作品,并且详
《CSSWeb设计高级教程(第2版)》注重Web开发的实践,每章以现实中的Web站点为例,提供了很多容易理解的CSS技巧和技术,例如,如何
计算机网络系统集成 本书特色 1.实用性强。面向应用型人才的培养,具有大量当前实用的个案实例研究,让学生学而有用,学而能用2.知识体系具备科学性及新颖性,借鉴国...
《危机时刻:德国保守主义革命》内容简介:本辑为读者呈现的是1933年纳粹政权前后,德国思想界影响深远的思潮:保守主义革命。这股
《从感觉开始》内容简介:陈嘉映经典学术随笔。世界在感觉里,感觉又在哪里? 真正的理解里也总有不曾完全明了的东西,清明的理解连
Fashionloversrejoice!TheseswanklittlebooksshowcaseAndyWarholsinimitablepicturesa...
"Arguably,oneofthebesttomes...TwitterPowerisjam-packedwithcleverwaystostartanddo...