宾夕法尼亚大学教授用1900页讲透了计算机科学数学基础,还是免费的!

程序员书库(ID:OpenSourceTop)

整理自:https://towardsdatascience.com/the-mathematics-of-machine-learning-894f046c568、https://en.wikipedia.org/wiki/Jean_Gallier、http://www.cis.upenn.edu/~jean/math-basics.pdf等

机器学习算是一个交叉领域,他涉及统计、概率、计算机科学和算法等方面,近几年机器学习发展快速,有人就想要入门学习数据科学领域,使用机器学习(ML)技术创造产品,但是想要很好的掌握其内部的工作原理和算法,有个坚固的数学基础是很有必要的。



为什么说数学很重要?


机器学习的数学之所以很重要,原因有很多,主要包括以下方面:

  • 机器学习需要选择正确的算法,包括训练时间、模型复杂度、参数个数等

  • 选择参数的设置和验证策略

  • 通过理解偏差-方差权衡,识别欠拟合和过拟合

  • 估计正确的置信区间和不确定性。



你需要什么数学水平?

当试图理解像机器学习这样的跨学科领域时,主要的问题是理解这些技术所需的数学知识量和自身的数学水平。



宾夕法尼亚大学计算机和信息科学系教授 Jean Gallier 的开源了一本书籍《Algebra, Topology, Differential Calculus, and Optimization Theory For Computer Science and Engineering》,用了1900页的内容,为读者讲解计算机科学所需的线性代数、微分和最优化理论等问题,这些内容对你深入学习机器学习帮助非常大。


这本书和其他的PDF资料不同,他们更像是作者的个人笔记,目的是帮助读者巩固相关知识,如果你读完这本书,就等同于将大学本科三年的数学课程学完了,而是是适用于CS的数学知识


内容涵盖微积分、线性代数、最优化理论、拓扑等知识,不过,令人纳闷的是,这本书竟然没有概率论这一部分的知识,主要分为10大模块:

1. 线性代数

2. 仿射几何和射影几何

3. 双线性形式的几何

4. 几何:PID、UFD、诺特环、张量、PID 上的模块、规范形

5. 拓扑和微分

6. 最优化理论基础

7. 线性优化

8. 非线性优化

9. 在机器学习中的应用

10. 附录


Jean Gallier教授会在每个知识点前面做一个概括性的总结,让读者对接下来的内容有个心理准备,比如,前面四个章节主要回顾基本的代数结构(群、环、域、向量空间),线性代数的基本概念,如向量空间、子空间、线性组合、线性无关等。讨论了对偶空间、超平面、线性映射等问题。


以下是本书的目录截图:





关于作者



Jean Gallier是宾夕法尼亚大学的教授,拥有法国和美国双国籍,1978年取得博士后学位就从事于计算机领域工作,发表过许多研究论文和书籍,其中《Computational geometry》、《Low-dimensional topology》、《Discrete mathematics》、《Discrete mathematics》等书籍的作者就是Jean Gallier



Jean Gallier有一个个人主页,在上面可以找到他曾经发表过的研究论文和书籍,大部分都可以免费下载,附上主页地址:http://www.cis.upenn.edu/~jean/home.html


书籍地址:http://www.cis.upenn.edu/~jean/math-basics.pdf

推荐↓↓↓
程序员数学之美
上一篇:1/2 + 1/4 + 1/8 + 1/16 + ... 一个级数问题的几何求解