机器学习与深度学习书单

来自:程序员阅读指北(微信号:CodersRead),作者:英子

机器学习简单分类

分类依据参考推荐图书,不权威


说起机器学习的缘起,通常大家都会提到这两位大佬:Arthur Samuel 和 Tom Mitchell。


1959 年,Samuel 首创 Machine Learning 一词,他给 ML 下的非正式定义为:

 Field of study that gives computers the ability to learn without being explicitly programmed.

「没有明确编程指令的情况下,能让计算机学习的研究领域就是机器学习。」


这个定义比较概括,1998 年,Tom Mitchell 给出了一个更为精确的定义:

Well posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

「“对于某类任务 T 和性能度量 P,如果一个计算机程序在 T 上以 P 衡量的性能随着经验 E 而自我完善,那么我们称这个计算机程序在从经验 E 学习。” 也就是说能够随着经验积累自动提升性能。」


这个定义比较学术哈,毕竟是学术界大佬给的,咱就应付个开场哈,别觉得很无趣~ 


Arthur Samuel ,计算机科学家,人工智能先驱,1956 年达特茅斯会议参与者,他写了第一个真正的机器学习下棋程序。让 Samuel 在机器学习领域扬名立万的这篇文章发表在 IBM Journal of Research and  Development 上,文章叫:“Some Studies in Machine Learning Using  the Game of Checkers” ,Samuel 彼时为 IBM 公司工程师。


Tom Mitchell ,机器学习领域先驱,卡内基梅隆大学教授,美国工程院院士,以人工智能、机器学习、认知神经科学等领域贡献著称。1997 年出版  Machine Learning 一书。


机器学习是人工智能的一种实现方法,其中涉及很多算法和模型。神经网络就是当前非常受欢迎的一种机器学习模型,而深度学习是应用了深度神经网络的机器学习。文章一开始的思维导图中简单地列出了一些比较常见的算法或者模型。


接下来我们就给出一些机器学习领域非常受欢迎或者比较有特色的图书,我会尽量少推荐几本。


程序员阅读指北「机器学习」书单

粗略用工程派和学院派分类

学院派图书难度稍大,并不绝对


- 机器学习 - 


Python 神经网络编程



作者:塔里克·拉希德(Tariq Rashid) 

译者:林赐 

原作名:Make Your Own Neural Network


不要被神经网络吓到,目测这本是所有图书里最简单的,不少豆瓣网友写书评号称这本是文科生也能看懂的机器学习入门书。作者在前言里表示他想让中学生水平的读者就能看明白这本书——用尽可能简洁明了的方式介绍神经网络的基本思路。看目录可能是只用了 3 层神经网络,所以还算是简单的机器学习算法,而不是深度学习。


Machine Learning For Absolute Beginners: A Plain English Introduction



作者:Oliver Theobald


The Hundred-Page Machine Learning Book 



作者: Andriy Burkov 


这两本书是英文版的,暂时没看到中文版,都很薄,在 150 页左右,是目前 Amazon 上比较受欢迎的入门书,从目录和试读看,读起来都相对轻松,第一本数学公式很少,第二本多一些。


机器学习实战:基于 Scikit-Learn 和 TensorFlow



作者:Aurélien Géron 
译者:王静源 / 贾玮 / 边蕤 / 邱俊涛 

原书名:Hands-On Machine Learning with Scikit-Learn and TensorFlow


这本是机器学习领域近年来的畅销书,原版 Amazon 评价非常好。偏实战,意在教你快速掌握构建人工智能系统的概念和工具。它分两部分讲,前半部分讲机器学习的基础理论知识和基本算法,以 Scikit-Learn 实现,后半部分讲深度学习和 TensorFlow,教你快速搭建和训练深度神经网络。


机器学习实战



作者:Peter Harrington 

译者:李锐,李鹏,曲亚东,王斌 

原书名:Machine Learning in Action


这本书算是工程领域的畅销经典了,出得比较早,虽然是 Python 2.x 实现,至今依然很受欢迎。如果你不够了解机器学习原理,但想快速通过代码上手机器学习,那这本不错,这也是很多自学者喜欢的路径。


机器学习



作者:周志华 


被读者称为西瓜书,不仅因为封面上有西瓜,西瓜也是贯穿全书示例的主角。这本是国内最畅销的机器学习图书。作者在前言中说它是入门级教科书,意在理清机器学习领域基本概念,让读者了解领域概貌。实际上,可能更适合已经了解机器学习基本概念,想认识机器学习原理(Why)、数学公式、算法实现的小伙伴;或者作为有教师讲解指导下的参考书。完全零基础自学(尤其是计算机和数学功底不够强)的读者,恐怕会被虐。


西瓜书内容全面系统,排版精致,书中给出了大量该领域的专业参考资料,方便大家深入学习,是原创学院派佳作。书后面也包括了深度学习和强化学习的内容。


统计学习方法 



作者:李航


又是一本评价非常好的原创图书,介绍了支持向量机、Boosting、最大熵、条件随机场等十个统计学习方法(也就是机器学习方法)。靠这本完全零基础入门依然是比较吃力,适合看推导和理解算法原理。


其他推荐


「入门课程」

吴恩达的《机器学习》是公认的非常棒的机器学习入门线上课程,Coursera 上虽然也有翻译,不过并不是以字幕形式:

https://www.coursera.org/learn/machine-learning/lecture/RKFpn/welcome;

英语吃力的同学,可以用网易公开课上的 CS229:https://open.163.com/movie/2008/1/M/C/M6SGF6VB4_M6SGHFBMC.html


「其他图书」

  • An Introduction to Statistical Learning: with Applications in R

  • The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition

  • Machine Learning: A Probabilistic Perspective

  • Pattern Recognition and Machine Learning

这四本书都是学院派的,第一本相对简单,剩下的三本有难度。


推荐↓↓↓
人工智能与大数据
上一篇:复旦大学博导邱锡鹏教授新书《神经网络与深度学习》,正式开源发布! 下一篇:机器学习梯度下降法,最通俗易懂的解释