《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《苏联与当代俄罗斯试验飞机》介绍了俄罗斯《苏联》所有类别的试验和研究飞机,包括发动机飞行试验台,如I0L—76LL。Tu—16LL;雷
《李商隐诗选》内容简介:李商隐,字义山,号玉溪生,又号樊南生,是唐朝后期杰出诗人之一,与杜牧并称“小李杜”。因卷入朋党斗争
《人力资源管理互联网思维》内容简介:本书采取“思维创新、顶层设计、体系重构、案例解读、规律提炼、转移运用”六大方法,以社会
《大视野》内容简介:这是一个“小确幸”和“大变局”不断深刻发生的时代。新冠疫情、全球经济低迷,失业潮、倒闭潮、债务潮,“去
《礼仪金说:职场礼仪》内容简介:《礼仪金说:职场礼仪》由知名礼仪专家金正昆教授根据多年社交经验与研究精心撰写,告诉职场人士
高性能集群计算:编程与应用 第二卷 内容简介 本书全面系统地介绍了高性能集群计算技术的概念、理论研究和工程实践成果。全书由两卷构成:系统与结构(**卷)和编程与...
《品中国文人1》内容简介:中国历史漫长而丰富。中国很早就有记载自己民族历史的优秀传统。本书尝试着从中国历代大文人的角度来勾画
《许崇德论基本法文集》内容简介:本书为许崇德教授在制定香港、澳门基本法过程中,发表的论文合集。许崇德教授2018年获评改革开放
算法设计,ISBN:9787302143352,作者:(美)克林伯格(Kleinberg,J.),()塔多斯(Tardos,E.)著,张立昂,屈婉玲译目录
《玩赚抖音短视频》内容简介:12大专题讲解,入门定位+内容创作+品牌营销+引流变现,玩赚抖音全攻略!120多个案例,实战性更强,助
mongodb如何帮你管理通过web应用收集的海量数据呢?通过本书的权威解读,你会了解面向文档数据库的诸多优点,会发现mongodb如此稳
《起来》内容简介:本书主要讲述了电影《风云儿女》摄制和《义勇军进行曲》创作的过程,以纪实文学的创作方式记录了艰难岁月中主创
《新旧之间》内容简介:本书以《樊山政书》所反映的清末法制变革中樊增祥任藩、臬两司的司法公文为研究对象,围绕转型时期的“变”
《科第冠海内,人文甲天下》内容简介:《科第冠海内,人文甲天下:明清江南文化研究》是南京大学历史学院范金民教授在江南文化研究
中文版Photoshop CC技术大全-(附光盘) 本书特色 这是一本全面介绍photoshop cc基本功能及实际运用的书。《中文版photoshop cc技...
《汽车材料及轻量化趋势》内容简介:作为提高汽车燃油经济性的手段之一,轻量化并不是新鲜的技术名词。从20世纪70年代以来,汽车轻
《微店+营销,你该这样玩》内容简介:微商,诞生于2009年,2014年开始被大家所熟知。微店的各种操作、功能都属于基础知识,是每个微
Python机器学习 本书特色 机器学习与预测分析正在改变企业和其他组织的运作方式,本书将带领读者进入预测分析的世界。全书共13章,除了简要介绍机器学习及Pyt...
《空间的语言》介绍了:这部独特的理论著作为我们提供了一个完事的建筑空间理念论述。布莱恩·劳森用最精炼通俗的语言对这个理念
《学术与时势:民国的边疆研究》内容简介:该书系统梳理了近代中国边疆研究的发展演变历程,探讨各时期边疆研究内容、方法的不同特