《从零进阶!数据分析的统计基础》共 6 章,分别讲解了数据分析的步骤和方法、描述性统计分析、抽样估计、假设检验、方差分析、相关与回归分析,使用简单的语言介绍了这些数据分析基本方法的核心思想和涉及的统计学、概率论等方面 的理论内容,并使用图示的方法详细介绍了使用 excel 2013 进行简单的描述性统计分析和使用 spss 进行相 关的数据分析的过程与结果分析。《从零进阶!数据分析的统计基础》适合需要提升自身数据分析理论和实践能力的职场新人;在市场营销、金融、财务、人力资源管理中需要数据分析的人士;从事咨询、研究、分析等的专业人士。也可以作为数据分析师职业培训的教材,普通高等院校非统计专业数据分析的选修教材。
cda数据分析师系列丛书按照数据分析师规范化学习体系而定,对于一名初学者,应该先掌握必要的概率、统计理论基础,包括描述性分析,推断性分析,参数估计,假设检验,方差分析,回归分析等内容,这在**本书《从零进阶!数据分析的统计基础》中进行了专业详细的讲解。其次,数据分析需要按照标准流程进行,即数据的获取、储存、整理、清洗、归约等系列数据处理技术,这在《如虎添翼!数据处理的sas eg实现》中利用sas eg和编程技术进行了操作过程的详解。*后,经过处理的数据需要根据业务问题,利用相关方法进行建模分析,得出结果,结果检验,绘制图表并解读数据,这在《胸有成竹!数据分析的sas eg进阶》中进行了详细的讲解和操作分析。cda数据分析师丛书整体风格是“理论>技术>应用”的一个学习过程,*终目的在于商业业务应用、职场数据分析,为欲从事于数据分析领域的各界人士提供了一个规范化数据分析师的学习体系。
第 1 章 数据分析概述 1
1.1 什么是数据分析 . 2
1.2 数据分析六步曲 . 2
1.2.1 明确分析目的和内容 . 2
1.2.2 数据收集. 3
1.2.3 数据预处理. 3
1.2.4 数据分析. 3
1.2.5 数据展现. 4
1.2.6 报告撰写. 5
1.3 数据分析方法简介 . 5
1.3.1 统计分析方法简介 . 5
1.3.2 数据挖掘方法简介 . 6
1.3.3 统计分析与数据挖掘的区别和联系 . 9
1.4 常用数据分析工具的安装 . 10
1.4.1 在 excel 2013 中安装数据分析工具 . 10
1.4.2 数据分析软件 spss 的安装 13
1.5 课后练习 . 18
第 2 章 描述性统计分析 19
2.1 直方图 . 20
2.1.1 什么是直方图. 20
2.1.2 如何看直方图. 20
2.1.3 如何画直方图. 20
2.1.4 使用 excel 2013 进行直方图的绘制 . 22
2.2 数据的计量尺度 . 24
2.3 数据的集中趋势 . 25
2.3.1 定量数据:平均数 . 25
2.3.2 顺序数据:中位数和分位数 . 27
2.3.3 分类数据:众数. 27
2.4 数据的离中趋势 . 28
2.4.1 极差 28
2.4.2 分位距 29
2.4.3 平均差 29
2.4.4 方差与标准差 30
2.4.5 离散系数 32
2.5 数据分布的测度 . 33
2.5.1 数据偏态及其测定. 34
2.5.2 数据峰度及其测定. 34
2.5.3 数据偏度和峰度的作用. 35
2.6 数据的展示——统计图 . 35
2.6.1 条形图与扇形图. 36
2.6.2 折线图 36
2.6.3 茎叶图 37
2.6.4 箱线图 40
2.6.5 统计图小结 42
2.7 使用 excel 实现数据的描述性统计及分析 43
2.7.1 使用 excel 实现三国全部武将武力描述性统计 43
2.7.2 使用 excel 分别实现三个国家武将武力描述性统计分析 44
2.8 课后习题. 45
第 3 章 抽样估计 . 48
3.1 抽样估计基础 . 49
3.1.1 随机事件 49
3.1.2 随机事件的概率. 50
3.1.3 随机变量及其概率分布. 52
3.1.4 随机变量的数字特征. 55
3.2 正态分布及三大分布 . 56
3.2.1 正态分布的概率密度函数. 56
3.2.2 正态分布的特征. 57
3.2.3 标准正态分布 58
3.2.4 基于正态分布的三大分布. 61
3.3 中心极限定理 . 63
3.3.1 中心极限定理的提法. 63
3.3.2 中心极限定理的内容. 64
3.3.3 中心极限定理的意义与应用 . 64
3.4 抽样估计 . 65
3.4.1 抽样估计概述. 66
3.4.2 抽样估计的基本概念 . 66
3.4.3 抽样估计的误差 . 70
3.4.4 抽样估计的理论基础 . 72
3.4.5 抽样估计的方法 . 73
3.4.6 抽样的组织形式 . 77
3.4.7 必要抽样数目的确定 . 78
3.5 课后习题 . 80
第 4 章 假设检验 86
4.1 假设检验概述 . 87
4.1.1 假设检验的概念 . 87
4.1.2 假设检验的基本思想 . 87
4.1.3 假设检验在数据分析中的作用 . 88
4.2 假设检验的分析方法 . 88
4.2.1 假设检验的基本步骤 . 88
4.2.2 假设检验与区间估计的联系 . 90
4.2.3 假设检验中的两类错误 . 92
4.2.4 利用 p 值进行决策 92
4.2.5 应用假设检验需要注意的问题 . 94
4.3 常见的检验统计量 . 94
4.3.1 z 检验统计量 95
4.3.2 t 检验统计量. 96
4.3.3 2 检验统计量. 97
4.3.4 f 检验统计量 . 97
4.3.5 各种检验统计量一览表 . 97
4.4 spss 中常用的几种 t 检验实例 99
4.4.1 单样本 t 检验 99
4.4.2 两独立样本 t 检验 102
4.4.3 人大经济论坛:于2003年成立,致力于推动经管学科的进步,传播优秀教育资源,目前已经发展成为国内最大的经济、管理、金融、统计类的在线教育和咨询网站,也是国内最活跃和最具影响力的经管类网络社区。人大经济论坛从2006年起在国内最早开展数据分析培训,累计培训学员数万人,在大数据的趋势背景下,作为Certified Data Analyst Institute(注册数据分析师协会,简称CDA协会)的中国唯一授权中心,根据CDA协会的数据分析师LevelⅠ(业务分析师)、Level Ⅱ(建模分析师)、Level Ⅲ(数据专家)的等级标准,致力于培养正规化、科学化、专业化的数据分析师队伍,为企事业单位输送更多优秀数据分析人才。(Certified Data Analyst Institute,亦称“注册数据分析师协会”,成立于美国特拉华州,主要宗旨为汇聚国际先进的数据分析技术,建设国际性规范化数据分析师职业标准,推进数据分析师的行业发展及认证工作,目前标准行业认证为CDA数据分析师)曹正凤,统计学专业博士,具有多年的数据分析项目实践经验和统计学教学经验,人大经济论坛CDA金牌讲师,北京石油化工学院实验师,研究方向为数据挖掘领域的前沿算法研究,包括随机森林算法、神经网络等,发表多篇论文,且发表的EI核心收录论文受到多次检索。从零进阶!-数据分析的统计基础 作者简介
Emotion.Ego.Impatience.Stubbornness.Characteristicslikethesemakecreatingsitesand...
《建筑学教程2:空间与建筑师》进一步充实了《建筑学教程1:设计原理》,拥有深厚的内涵。《建筑学教程2:空间与建筑师》追溯了他近
中文版Windows7 从入门到精通 本书特色 《从入门到精通系列:中文版windows 7从入门到精通》特点一本图书 三本价值1本书=入门十提高十精通=3本书...
《唐朝定居指南》内容简介:《唐朝定居指南》是《唐朝穿越指南》的姊妹篇。以浅显风趣的笔调,介绍唐人衣、食、住、行、语言、娱乐
《大型IT系统性能测试入门经典》内容简介:《大型IT系统性能测试入门经典》是一本来自性能测试实战领域的专家作品,主要用来指导性
《曾国藩家书》内容简介:本书辑录了曾国藩在清道光30年至同治10年前后达30年的翰苑和从武生涯的书信一百六十余篇。家书涉及的内容
Python在Unix和Linux系统管理中的应用 本书特色 《Python在Unix和Linux系统管理中的应用(影印版)》为开明出版社出版发行。Python...
《Boost程序库完全开发指南:深入C++"准"标准库》内容简介:Boost是一个功能强大、构造精巧、跨平台、开源并且完全免费的C++程序库
《中国财政科研教学的“老兵”:邓子基传》内容简介:邓子基是我国著名经济学家、财政学家和教育家、中华人民共和国财政学奠基人和
单片机实验与实践教程-(二)(第2版) 内容简介 本书为《单片机系列教程》之一,较之第1版,增删了部分内容。保留了第1版中循序渐进、汇编语言与高级语言并重、串并...
《精通CSS+DIV网页样式与布局》从零开始,细致介绍CSS的语法规则,透彻讲解CSS应用于各种网页元素的步骤和技巧深入剖析,CSS+DIV
《JavaScript异步编程:设计快速响应的网络应用》讲述基本的异步处理技巧,包括PubSub、事件模式、Promises等,通过这些技巧,可
《高达模型制作技巧指南》内容简介:本书主要介绍制作高达模型用到的工具、油漆种类、涂装技巧、特殊效果涂装等知识。为了不让大家
jQuery:NovicetoNinjaisacompilationofbest-practicejQuerysolutionstomeetthemostcha...
从光学电报到无绳电话,我们的交流关系是怎样形成的?这就是本书所试图回答的问题。在这本书中,帕特里斯•费里奇详细描述了第一批
《信息的社会层面》分析了近年来信息技术对人类社会所产生的冲击,对信息至上论进行了批判性反思。作者认为,信息是植根于社会生
《再见啦,那些让人忧心的生活谣言》内容简介:本书选取的谣言内容大部分来自微信文章,非常具有传播性。谣言内容覆盖范围广,包括
《以兴趣为职业的“记”者:方汉奇传》内容简介:方汉奇是中国人民大学荣誉一级教授,是中国新闻学最早的三位博士生导师之一,在中
《工业X.0》内容简介:数字化的巨轮早已扬帆远航,任何持怀疑态度的人都无力阻止,无论是民众还是商业领袖。工业企业整体构成了全球
《锂离子电池智能制造》内容简介:本书是“21700动力锂电池智能制造新模式项目”的结题成果,项目归口管理部门是工业和信息化部。本