《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《中医学教学医案选编》内容简介:本书是上海交通大学医学院2016年度课程、教材建设基金资助项目。以中医基础理论为核心,紧密结合
《无线数据通信技术揭密》介绍了高速无线数据网络和移动因特网技术。重点是指导有经验的移动因特网专业技术人员快速安装无线数据
《GPU精粹:实时图形编程的技术技巧和技艺》汇集了当今国际上前沿开发者们经多年研究和实践得出的实用的实时图形技术成果。《GPU精
如何能牢牢地黏住老用户、吸引新用户、读懂用户的偏好兴趣和喜怒哀乐,这都是对企业发展至关重要甚至关乎生死存亡的问题,解决这
《翁文灏与抗战档案史料汇编(上、下册)》内容简介:本资料集收录了翁文灏与抗战有关的档案史料,有五个方面的内容:一是战前政治
多传感器图像融合技术及应用 本书特色 本书以图像融合技术的发展历程为主线,系统介绍了图像融合的基本概念、融合原理、融合方法、*新研究进展及应用实例。?全书共11...
《让我去那花花世界》内容简介:本书收录了苗炜多年来的旅行随笔,他探访名城,在耶路撒冷、巴黎、东京、伦敦、莫斯科寻找历史和文
《青春红楼:红楼梦整本书阅读》内容简介:在《红楼梦》被纳入高考必读书目,以及“整本书阅读”被不断强调的当下,本书作者作为一
《Python编程:从入门到实践》内容简介:本书是一本针对所有层次的Python读者而作的Python入门书。全书分两部分:第一部分介绍用Py
《西城追忆·抗战西城》内容简介:2015年初,西城区档案局(馆)与西城区文物研究所合作出版的《西城追忆·文物保护专辑》,深受各
《职场晋升101》内容简介:职场没有白走的路,但确实存在很多的弯路。不是每一个坑你都必须亲自去踩,提前练好职场基本功,就可以让
置身亞洲大陸邊緣的台灣,浮晃於古老東方、近代西洋、南島語族等文化激流之處。亞洲文明,是台灣的一部份,認識亞洲,不能自限於
《敦煌的光彩:常书鸿、池田大作对谈录》内容简介:本书是首任敦煌研究院院长、被誉为“敦煌守护神”的常书鸿先生与日本著名思想家
互联网使世界成为一个大家庭,而网站便已成为当下国际文化经济交流的主要平台和交互窗口。与此同时优秀的创作人、设计师、艺术家
《复变函数与积分变换学习辅导与习题全解(华中科大•2版)》是与《复变函数与积分变换》(第二版)(华中科技大学数学系编)配套的学习
本教材以力学理论和控制理论的全面讲述为特色。教材的重点在于用严谨而系统的方式介绍机器人动力学与控制的基本概念和主要结果。
本书从讲解什么是数据结构开始,延伸至高级数据结构和算法分析,强调数据结构和问题求解技术。本书的目的是从抽象思维和问题求解
《链接:社交时代的品牌法则》内容简介:社交时代,个体崛起,个体成为经济的基本单元,链接个体成社群是商业的核心逻辑。本书作者
这本书分城市广场、邻里公园、小型公园和袖珍公园、大学校园户外空间、老年住宅区户外空间等部分,系统地阐述了城市空间设计的理
Oracle达人修炼秘籍-Oracle 11g数据库管理与开发指南 本书特色 ·宏观上清晰呈现oracle数据库的知识体系和总体框架,微观上系统讲解oracle...