machine learning方面最值得推荐的11本书(9本ML+2本DM)

迈克尔%&唐僧

1. 机器学习
作者: (美)Tom Mitchell
出版社: 机械工业出版社
评语 : 现在看来,这本书也许是过时了。但在那个年代,这是开天辟地的一本书。第一章就清楚定义了什么是ML:本质是在给定的搜索空间和计算资源下,近似一个函数。 <RET> 虽然今天大家都用统计的手段来研究ML,模型和优化算法都有了极大的发展,应用也更加五花八门,计算能力和当年更不是一个数量级。不过,看看这本书哪些观点过时了,哪些观点现在仍然是公认的,也是一件很好玩的事情。

2. The Elements of Statistical Learning
作者: Trevor Hastie/Robert Tibshirani/Jerome Friedman
出版社: Springer
评语 : 作者都是正统统计出身大牛,说是element,其实一点也不。06年刚学ml时啃它,没懂,再啃一遍,还是没懂。3年后继续,才觉得博大精深。当然,中文翻译得拗口也有一定原因,所以还是看原版把,都可以从作者主页免费下的。 <RET> 这本书读起来更像是product review,在介绍的同时夹杂了大量算法模型优缺点对比,这当然是作者功力的显现,但不适合初学者。第二版较以前新加了大量关于sparse model的章节,很推荐。不过,对graphic model等似乎写得过于简略了。

3. Pattern Recognition And Machine Learning
作者: Christopher M. Bishop
出版社: Springer
评语 : 不同于楼上的ESL,这本几乎完全是bayesian的观点,graphic model章节自然是亮点。不过,最大的特点是覆盖面广,写得非常的通俗易懂。即使是用bayesian这种公式相对多,概念相对绕的表述,bishop仍然举重若轻,写得文笔流畅,洋洋洒洒。所以非常适合入门。

4. Machine Learning - A Probabilistic Perspectiv
作者: Kevin P. Murphy
出版社: The MIT Press
评语 : 观点介于楼上PRML的bayesian和楼上上ESL的frequentist之间,1000+页,cover面非常之广,从经典模型算法到当下的stochastic optimization, deep learning. 公式不多,语言简练,通俗易懂。非常适合初学者。 <RET> 缺点是,这似乎更像是一本百科全书。一个词条接一个词条,读起来破为无趣。

5. Learning From Data
作者: Yaser S. Abu-Mostafa/Malik Magdon-Ismail/Hsuan-Tien Lin
出版社: AMLBook
评语 : 对这本书没有太多评价,不过Yaser在caltech的课上得很精彩。对ml的很多概念有非常直白的解释。当年他在主页上公开鄙视Adrew Ng的ML公开课,也是有一定道理。http://work.caltech.edu/telecourse.html

6. Foundations of Machine Learning
作者: Mehryar Mohri/Afshin Rostamizadeh/Ameet Talwalkar
出版社: The MIT Press
评语 : 和ESL一样,也是用的frequentist的观点,也是一点都不foundation。不同是,作者都是CS出身,所以写的味道更CS点。如果对bound有爱就读吧。

7. Bayesian Reasoning and Machine Learning
作者: David Barber
出版社: Cambridge University Press
评语 : 彻底的Bayesian。还木有读。

8. Machine Learning for Hackers
作者: Drew Conway/John Myles White
出版社: O'Reilly Media
评语 : 手把手教如何用ML来解决诸如垃圾邮件过滤之类的应用,用R。

9. Machine Learning in Action
作者: Peter Harrington
出版社: Manning Publications
评语 : 还是讲如何跑ML算法,用python。可以认为是源代码+注释+实验结果贴图。

10. Data Mining
作者: Han, Jiawei; Kamber, Micheline; Pei, Jian
评语 : 好吧。和楼下这本一起,是data mining教材。如果不想看公式的话,这是可选读物。

11. Data Mining
作者: Ian H. Witten/Eibe Frank/Mark A. Hall
出版社: Morgan Kaufmann
评语 : weka是data mining里最有名的工具包,这是使用手册。


我说:最怕被OLers鄙视(以前有过)说lz你读过几本啊,推荐这么多?我澄清一下吧,第一本我读过,《4. Machine Learning - A Probabilistic Perspectiv》这本我正在读,所以,作为一个菜得不能再菜的人,我只能是看到好东西分享一下,牛人亲拍。
另外有几本是我2013年的目标/计划。

除此之外,Computer Vision: A Modern Approach这一类书也是很好的教材。



有梦想谁都了不起。------迈克尔&%唐僧
雪山来客
Mark .组织,希望能和楼认识!

淡定啊
sun
mk

<html>
<marquee> fire
</marquee>
<html>
骑着蜗牛跑
ml火的一塌糊涂,码农要走可持续发展道路,这个还是要学的,今天怒买了几本数学书准备开始学了。

http://weibo.com/zhaizhiqiangnwpu
马小木
读书的心珍贵

Waiting is a long long joke~
小笨霖
MK!

耶和华阿,尊大,能力,荣耀,强胜,威严都是你的。凡天上地下的都是你的。国度也是你的,并且你为至高,为万有之首。
內內
感觉和我么搞统计信号处理的东西也差不太多……


vs01
M

------------------------------------------------------------------------
vs01

唐僧,我好像知道你是谁了,哈哈~~



------------------------------------------------------------------------
Perhaps呜呜啦
MARK

女人不要以为长的好就可以不念书,男人不要以为书读的好就可以长的难看.
迈克尔%&唐僧


vs01 #15
唐僧,我好像知道你是谁了,哈哈~~
mb我发个贴就能被认出来?给跪了,这还让我怎么敢在发帖?你看我都潜水多久才出来冒一次泡,我不容易啊。



有梦想谁都了不起。------迈克尔&%唐僧
清江
m

准确定位自己,不迷糊,不犹豫