机器学习/深度学习书单推荐及学习方法

机器学习算法工程师

所谓的“大数据”在近两年来极其火爆,甚至连街头巷尾的买菜大妈都知道。大数据最根本的基础是机器学习/深度学习,然而很多程序员们想要从事数据岗位的工作却不知如...

文章正文

写在前面

本人是个对数学和人工智能极其感兴趣的人。平时,我也在线上线下经常与国内外的朋友讨论人工智能的各种方面,无论是技术方面还是哲学方面。我帮助过很多实习生和网上的学生,带领他们从入门一步步过渡到足够从事数据挖掘工作。在此期间,我发现了一件很有趣的事情,所有技术好的数据分析/挖掘工作者,都是喜欢"主动学习"的人。

这次在GitChat上发起Chat,就是想帮助更多喜欢数据科学、喜欢主动学习的人能够少走弯路。这个Chat中主要讨论的是如何入门学习机器学习/深度学习的理论知识、如何着手数据挖掘项目以及从事数据挖掘相关岗位所需要的能力。

正文

不论你是学生、想转行数据岗位的在职程序员,都需要自学达成目标,我本身就是一个苦逼自学者例子。

我的本硕都是计算机专业,由于本科搞的是算法编程,硕士开始搞机器学习方向本来也比较适合,但机器学习算法真的让我头疼了很久。在慢慢攻克了机器学习算法,并学到一定程度后,我发现真正的数据挖掘绝不仅仅是会机器学习算法就够了,还要学习很多东西,比如数据清洗等等技巧。作为一个"过来人",我明白大家在学习中会遇到的困惑。我此次,就是来帮助大家解除困惑。

关于机器学习,非数学/统计专业的人都会有这些疑问:

  1. 到底要把数学学到什么程度才能够无障碍地推导机器学习算法?实变、复变、泛函、矩阵论到底要不要全都学会?
  2. 入门机器学习到底要看什么书?
  3. 除了机器学习,真正的工作中还哪些必要技巧?
  4. 如何入门深度学习?
  5. 如何着手开始进行数据挖掘项目?

下面,我会对以上问题逐个进行细致分解,结合自己的学习及工作经历为你一一解答,并给你提出适合建议。

数学要到什么程度?

从最基础的来说,微积分、线性代数与概率论是学习机器学习的必会内容。相信大家看到这个答案会很失望,但是放心,这绝对不像你想象的那么难。在本科期间,我们学习数学的目的其实是为了期末考试,需要做很多习题。而在机器学习中,使用到的仅仅是这些他们的特性,而不需要用他们来解题,所以只要知道他们的定义就可以。

比如线性代数,我们仅仅需要了解向量、矩阵和逆矩阵等等的定义,而不需要

2017年11月13日,周一晚上8点30分。阿里巴巴数据岗位从事3年的半老司机,阿里巴巴数据挖掘工程师刘明带来了主题为《机器学习/深度学习书单推荐及学习方法》的交流。以下是主持人飘静整理的问答实录,记录了作者和读者问答的精彩时刻!


内容提要:

  • 现在反而是最优化方面比较虚,不知道这方面有没有什么推荐的?主要是好多书都是从集合极限上下界开始讲,不知道有没有比较干货的推荐?
  • 目前是在校学生,本科机械,研究生虽然还是在机械大学科,但目前读研方向是大数据和机器学习,这样会不会转的太大了?
  • 对于完全没有学过线数和概率论的人,有什么建议吗?有什么在线课程推荐吗?或者应该重点学习哪些章节?
  • 数据挖掘需要大数据支撑,需要了解hadoop的知识吗?
  • 机器学习在数据挖掘中的应用,具体可以做什么,有什么案例可以分享吗?
  • Python需要掌握到什么程度就可以实战了?
  • 有时光看光听缺少练习,记不住也很容易忘记,想请你介绍一下,如何边学习边练习,可以制定一年入门和会使用api的计划安排吗,以及如何校正自己的学习成果?
  • 目前是计算机专业研二的学生,对 hadoop 大数据相关组件一定了解和使用经验。想继续学习机器学习相关算法和应用。现在感觉如果重新看你建议的考研系列书和机器学习基石得花好多时间,是否必须复习完基础数学再进行算法学习? 还是可以看一个算法不会的数学内容再去找资料翻?
  • 请问作为一个前端开发如何利用机器学习/深度学习变现?
  • 在学习的过程中,是将机器学习的各种算法和模型先学一遍,将基础弄懂后再用工具(比如python)实现做项目?还是学一个算法就用工具实现出来?
  • 如何学好基础并很有提高实战能力?
  • 我是一个新手,看了很多python和机器学习的书籍后遇到实际问题还是不知道如何着手,比如知道书上的理论有哪几种方法可以实现,但是拿到数据后知道用哪种方法,该如何实现,如何打好基础并提高实战能力?
  • 请问机器学习门槛高吗,自学真的适合吗?目前我大二非计算机专业对机器学习及大数据感兴趣,想开始自学合适吗?还有自学没有老师会不会花费太多时间走弯路啊?最后想问一下有什么途径可以进行一些实战?
  • 以后如果要从事机器学习工作的话是不是现在还得学好各种数据结构和算法的知识,还有做机器学习项目有没有好的入门项目推荐和别人的代码借鉴?
  • 我也是一个新手,目前困扰我最大的问题是,我照着教程安装不上一些python库,在网站上差不到能解决问题的方法,问一些人给的答案又都是让我百度谷歌。比如安不上pymysql怎么办?
  • 请问本科专业是机械,研究生准备从事机器学习/大数据和相关行业的交叉学科,然而编程基础和数学基础较为薄弱,机器学习初期最应该以什么为重,才能在之后的路上更加畅通?
  • 总感觉看了python数据分析的书后,不看书的话还是不会自己写代码处理数据,是不是有必要看pandas或者scikit-learn等英文文档了解里面的所有功能再多练习?
  • 我是同时学
隐藏内容 支付可见
购买文章 ¥3.99
订阅频道首月仅需 12 元/月,预计可省 1288 元
¥3.99
¥3.99购买
订阅频道免费读
× 订阅 Java 精选频道
首次订阅 ¥ 12 元/月 15元/月
订阅即可免费阅读所有精选内容