《复杂数据统计方法——基于r的应用》用自由的日软件分析30多个可以从国外网站下载的真实数据,包括横截面数据、纵向数据和时间序列数据,通过这些数据介绍了几乎所有经典方法及最新的机器学习方法。
《复杂数据统计方法——基于r的应用》特点:(1)以数据为导向;(2)介绍最新的方法(附有传统方法回顾);(3)提供r软件入门及全部例子计算的日代码及数据的网址;(4)各章独立。
《复杂数据统计方法——基于r的应用》的读者对象包括统计学、应用统计学、经济学、数学、应用数学、精算、环境、计量经济学、生物医学等专业的本科、硕士及博士生,各领域的教师和实际工作者。
第1章引言
1.1作为科学的统计
1.2数据分析的实践
1.3数据的形式以及可能用到的模型
1.3.1横截面数据:因变量为实轴上的数量变量
1.3.2横截面数据:因变量为分类(定性)变量或者频数
1.3.3纵向数据,多水平数据,面板数据,重复观测数据
1.3.4多元数据各变量之间的关系:多元分析
1.3.5路径模型/结构方程模型
1.3.6多元时间序列数据
1.4 r软件入门
1.4.1简介
1.4.2动手
第2章横截面数据:因变量为实数轴上的数量变量
2.1简单回归回顾
2.2简单线性模型不易处理的横截面数据
2.2.1标准线性回归中的指数变换
2.2.2生存分析数据的cox回归模型
2.2.3数据出现多重共线性情况:岭回归,lasso回归,适应性lasso回归,偏最小二乘回归
.2.2.4无法做任何假定的数据:机器学习回归方法
2.2.5决策树回归(回归树)
2.2.6boosting回归
2.2.7bagging回归
2.2.8随机森林回归
2.2.9人工神经网络回归
2.2.10支持向量机回归
2.2.11几种回归方法五折交叉验证结果
2.2.12方法的稳定性及过拟合
第3章横截面数据:因变量为分类变量及因变量为频数(计数)变量的情况
3.1经典logistic回归,probit回归和仅适用于数量自变量的判别分析回顾
3.1.1logistic回归和probit回归
3.1.2经典判别分析
3.2因变量为分类变量,自变量含有分类变量:机器学习分类方法
3.2.1决策树分类(分类树)
3.2.2adaboost分类
3.2.3bagging分类
3.2.4随机森林分类
3.2.5支持向量机分类
3.2.6最近邻方法分类
3.2.7分类方法五折交叉验证结果
3.3因变量为频数(计数)的情况
3.3.1经典的poisson对数线性模型回顾
3.3.2使用poisson对数线性模型时的散布问题
3.3.3零膨胀计数数据的poisson回归
3.3.4使用机器学习的算法模型拟合计数数据
3.3.5多项logit模型及多项分布对数线性模型回顾
第4章纵向数据(多水平数据,面板数据)
4.1纵向数据:线性随机效应混合模型
4.2纵向数据:广义线性随机效应混合模型
4.3纵向数据:决策树及随机效应模型
4.4纵向数据:纵向生存数据
4.4.1cox随机效应混合模型
4.4.2分步联合建模
4.5计量经济学家的视角:面板数据
第5章多元分析(不区分因变量及自变量)
5.1实数轴上的数据:经典多元分析内容回顾
5.1.1主成分分析及因子分析
5.1.2分层聚类及k均值聚类
5.1.3典型相关分析
5.1.4对应分析
5.2非经典多元数据分析:可视化
5.2.1主成分分析
5.2.2对应分析
5.2.3多重对应分析
5.2.4多重因子分析
5.2.5分层多重因子分析
5.2.6基于主成分分析的聚类
5.3多元数据的关联规则分析
第6章路径建模(结构方程建模)数据的pls分析
6.1路径模型概述
6.1.1路径模型
6.1.2路径模型的两种主要方法
6.2 pls方法:顾客满意度的例子
6.3协方差方法简介
6.4结构方程模型的一些问题
第7章多元时间序列数据
7.1时间序列的基本概念及单变量时间序列方法回顾
7.1.1时间序列的一些定义和基本概念
7.1.2常用的一元时间序列方法
7.2单位根及协整检验
7.2.1概述
7.2.2单位根检验
7.2.3协整检验
7.3varx模型与状态空间模型
7.3.1varx模型拟合
7.3.2状态空间模型拟合
7.3.3模型的比较和预测
附录练习:熟练使用r软件
参考文献
《新税法下企业纳税筹划(第7版)》内容简介:本书根据最新的税收政策论述了企业所得税、个人所得税、增值税、消费税等主要税种的纳
《阅读理解高分6法:文体法》内容简介:阅读理解想要拿高分,文章读不透,学习再多答题技巧也是事倍功半!本书聚焦“文章如何读”“
《电子商务英语教程》内容简介:本书选材广泛,覆盖了电子商务的类型、电子商务解决方案、B2B、B2C、在线销售、电子商务网站建设与
《李致文存·我的书信》内容简介:《李致文存》第五卷,则收录了李致与巴金的诸多书信,还有曹禺、张爱萍、李又兰、戈宝权、冯骥才
网络操作原理 内容简介 《网络操作系统》全面、系统地论述了网络操作系统的基本概念、基本原理以及相关技术,反映了当代计算机网络操作系统发展的新动向、新水平。全书共...
本书是Android应用开发工程师和Android系统工程师进阶修炼的必读之作。它由资深Android内核专家亲自执笔,从源代码角度,系统、深
《翁文灏与抗战档案史料汇编(上、下册)》内容简介:本资料集收录了翁文灏与抗战有关的档案史料,有五个方面的内容:一是战前政治
《简说IPv6》内容简介:本书详细讨论了与IPv6技术相关的内容,包括互联网的概念、历史、发展与演变,我国IPv6的发展与机遇,以及IP
HiddenontheInternet,scatteredamongbillionsofWebpages,arethecluestoanincrediblese...
《数字调制解调基础(双色)》是21世纪电子电气工程师系列之一,主要讲解IT技术中最关键、最基本的调制解调技术,内容深入浅出,通
《一小时漫画基金实战法》内容简介:基金投资是非常适合普通人的一种投资方式,但在投资之前,我们先要搞懂基金是什么、基金是怎么
本书以Xinu(一个小型简洁的操作系统)为例,全面介绍操作系统设计方面的知识。本书着重讨论用于嵌入式设备的微内核操作系统,采
《MMA综合格斗实战技术训练全书(全彩图解版)》内容简介:本书首先介绍了MMA的规则、格斗体位及训练方法等基础知识。接着,本书采
本书主要以Fireworks网页效果图设计为主线,介绍网页效果图的设计流程和网页中各种页面元素的设计。书中按照网页的构成元素,如布
《小学生减压涂色书——给古诗涂上颜色》内容简介:这套书秉承着“疗愈效果的是传统之美”的理念,在诗、词、曲和神话中选取涂色的
《纳米忆阻器与神经形态计算》内容简介:本书旨在深入了解纳米级器件的工作原理,重点介绍非易失性存储器、神经网络训练/学习的各种
《现代物流管理(第三版)》内容简介:本书是高职高专规划教材《现代物流管理》的第三版,内容包括:现代物流与物流管理,企业物流
《拯救社交脸盲症》内容简介:本书是一部激励心灵的励志作品,本书主要通过社交心理学、社交技巧学、社交口才学等诸多成功要素,深
Excel图表·公式·函数·数据分析从新手到高手:畅销升级版 本书特色《excel 图表.公式.函数.数据分析从新手到高手(畅销升级版)》内容覆盖了excel ...
《直觉泵和其他思考工具》内容简介:哲学泰斗倾囊传授77招思维搏击术,助你清醒思考,看破一切套路!陈嘉映、汪丁丁、万维钢诚意推