Andrew.Ng 机器学习笔记

啥是机器学习?

ETP

- Experience
- Task
- Performance

为了完成某项任务,通过训练,使得机器获取经验,从而达到很好的准确率。 这就好比巴甫洛夫通过不断摇铃,使得狗有了预判接下来有食物吃的能力一样。

那么,在机器学习的过程中,我们应该做什么呢? 我们应该让机器有趋利避害的能力。这样,机器就会在不断的矫枉过正的曲线上趋于稳定。 正如我们练习投篮一样,在不断的练习中,肌肉获取了大概以某种姿势,某种力道就能投进篮球。

啥是监督学习?

这是从经验获取知识的一个过程。 就好比,在无数次看了股票的涨跌之后,我们习得了看见红色就高兴,看见绿色就悲伤的知识。 相反的,对于无监督学习,则是我们没有告诉机器一些已知的结果,他也无从学习,只能天真的把距离近的划为一类,远的划为另一类。

如何选择模型?

这一切围绕 ETP 里的 Performance 进行选择。 既要与现有的经验吻合,又不能太死板(过拟合),不能应付新事物。 所以,选择好的代价函数 或者说惩罚函数是至关重要的。 一般来说,好的代价函数我觉得要有以下考量:

  • 凸函数

  • 统计学的两类错误的权衡

凸函数不会遇到局部最优的情况。 两类错误的权衡,好比是错杀一千还是放过一千的考量。比如说信用卡诈骗和抓捕罪犯对两种错误权衡就不一样了。

Published by Taoge on 2017-05-31 00:00:00