微信扫码下载

编辑推荐

适读人群:《大数据数学基础(R语言描述)》可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自学用书。

大数据数学基础(R语言描述)》大部分章节紧扣实际需求展开,不堆积知识点,着重于解决问题时思路的启发与方案的实施,帮助读者真正理解与消化大数据数学基础。
书中案例全部源于企业真实项目,可操作性强,引导读者融会贯通,并提供源代码等相关学习资源,帮助读者快速掌握大数据相关技能。

内容简介

大数据数学基础(R语言描述)》全面地讲解了在科学领域运用广泛的数据微积分、线性代数、统计学、数值计算、多元统计分析等数学基础知识。《大数据数学基础(R语言描述)》共6章:第1章介绍了大数据与数学、数学与R语言的关系;第2章介绍了微积分的基础知识,包括函数、极限、导数、微分、不定积分与定积分及其应用;第3章介绍了线性代数的基础知识,包括矩阵的运算、行列式、特征分解、奇异值分解;第4章介绍了统计学的基础知识,包括数据分布特征、概率论、随机变量的数字特征、参数估计、假设检验;第5章介绍了数值计算的基础知识,包括插值方法、函数逼近与拟合、非线性方程(组)求根;第6章介绍了常用的多元统计分析方法,包括回归分析、聚类分析、判别分析、主成分分析、因子分析和典型相关分析。《大数据数学基础(R语言描述)》中的几乎所有实例都结合R语言进行求解分析,所有章后都有课后习题,可以帮助读者巩固所学的内容。

作者简介

张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数20余篇,已取得国家发明专利12项,主编《Hadoop大数据分析与挖掘实战》《Python数据分析与挖掘实战》《R语言数据分析与挖掘实战》等多本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。

目录

第1章绪论1
1.1大数据与数学1
1.1.1大数据的定义1
1.1.2数学在大数据领域的作用2
1.2数学与R语言4
1.2.1base5
1.2.2stats5
小结6
课后习题6
第2章微积分基础8
2.1函数与极限8
2.1.1映射与函数9
2.1.2数列与函数的极限14
2.1.3极限运算法则与存在法则17
2.1.4连续函数的运算与初等函数的连续性18
2.2导数与微分19
2.2.1导数的概念19
2.2.2函数的求导法则24
2.2.3微分的概念26
2.3微分中值定理与导数的应用30
2.3.1微分中值定理30
2.3.2函数的单调性与曲线的凹凸性31
2.3.3函数的极值与最值34
2.4不定积分与定积分39
2.4.1不定积分的概念与性质40
2.4.2换元积分法与分部积分法44
2.4.3定积分的概念与性质46
2.4.4定积分的换元法与分部积分法50
2.4.5不定积分与定积分的实际应用51
小结53
课后习题54
第3章线性代数基础56
3.1矩阵及其运算56
3.1.1矩阵的定义56
3.1.2特殊矩阵57
3.1.3矩阵的运算61
3.1.4矩阵行列式65
3.1.5矩阵的逆78
3.1.6矩阵的秩80
3.2矩阵的特征分解与奇异值分解84
3.2.1特征分解84
3.2.2奇异值分解96
小结100
课后习题101
第4章概率论与数理统计基础103
4.1数据分布特征的统计描述103
4.1.1集中趋势度量103
4.1.2离散趋势度量110
4.1.3偏度与峰度的度量115
4.2随机事件及其概率117
4.2.1随机事件的定义117
4.2.2随机事件的概率119
4.3随机变量与概率分布122
4.3.1随机变量的定义122
4.3.2随机变量的分布函数122
4.4随机变量的数字特征127
4.4.1随机变量的数学期望127
4.4.2随机变量的方差130
4.4.3协方差与相关系数132
4.4.4协方差矩阵与相关矩阵134
4.5参数估计与假设检验137
4.5.1参数估计137
4.5.2假设检验139
小结142
课后习题142
第5章数值计算基础144
5.1数值计算的基本概念144
5.1.1误差的来源144
5.1.2误差分类146
5.1.3数值计算的衡量标准147
5.2插值法147
5.2.1Lagrange插值147
5.2.2线性插值150
5.2.3样条插值152
5.3函数逼近与拟合153
5.3.1数据的最小二乘线性拟合153
5.3.2函数的最佳平方逼近155
5.3.3数据的多变量拟合158
5.3.4数据的非线性曲线拟合160
5.4非线性方程(组)求根162
5.4.1二分法求解非线性方程163
5.4.2Newton法求解非线性方程165
5.4.3Newton法求解非线性方程组166
小结169
课后习题170
第6章多元统计分析172
6.1回归分析172
6.1.1一元线性回归172
6.1.2多元线性回归178
6.1.3Logistic回归184
6.2聚类分析189
6.2.1距离和相似系数189
6.2.2系统聚类法193
6.2.3动态聚类法198
6.3判别分析200
6.3.1距离判别200
6.3.2贝叶斯判别204
6.3.3费希尔判别205
6.4主成分分析206
6.4.1总体主成分207
6.4.2样本主成分209
6.5因子分析211
6.5.1正交因子模型212
6.5.2参数估计214
6.5.3因子旋转218
6.5.4因子得分220
6.6典型相关分析222
6.6.1总体典型相关222
6.6.2样本典型相关223
6.6.3典型相关系数的显著性检验228
小结229
课后习题230
附录It分布表236
附录IIF分布表238
参考文献250


其他推荐