一种更简单的理解机器学习的方法

来自:极验(微信号:geetest_jy),作者:Gideon Rosenblatt,编辑整理:萝卜兔,原文链接

我经常发现,关于机器学习的解释要么太复杂,要么太简单。最近,我发现可以使用一个简单的框架向人们解释清楚它。


机器学习的核心


剖开表面,机器学习的核心其实是一种“统计思维”。长期以来一直用各种工具来对数据进行统计分析,而机器学习是更加自动化的一种工具,因此可以在更加广阔的领域使用它。基本技术已经存在数十年了,但是机器学习却是得益于处理器计算能力的提升和互联网服务的成熟,带来了大规模数据集。


吴恩达说过,计算力是机器学习的引擎,而数据是它的燃料。机器学习这架飞机不是让你飞到芝加哥,而是建立统计模型。这些机器学习模型利用基础数据来模拟现实,有点像我们用大脑模拟现实的方式。不同的是,这些算法模型扩展了我们生物大脑能做的事情:从统计学的角度去思考。


大数据和模型


其实,很早我们就开始使用机器学习来自动化地建立统计模型。它为过去使用的劳动密集型统计技术节省了大量的时间和精力,同时也开辟了新的功能,比如分析仓库中的库存水平,估计过度捕捞问题,以及预测库存价格等等问题。


这种类型的问题通常被称为“大数据”或者数据分析。在早期的阶段,模型通常都是静态的,是对底层数据的一种快照式分析。尽管存在这种限制,但这些技术在理解大型数据集方面证明很有价值,这在大型企业中非常受欢迎,并且导致了数据分析公司蓬勃发展的生态系统。


深化数据化


值得一提的是,现在我们用来自动构建这些统计模型的方法之——深度学习。它是这几年风靡的一种技术。如此受欢迎的原因是允许开发人员通过提供大量的数据来自动构建模型。这些神经网络有很多层,就像我们的大脑那样。这些网络的底层主要识别数据的最基本和特定的特征,将结果移交给后续层,后续层又逐步处理数据的更复杂和更高维的特征。

上图是来自英伟达,显示了深层神经网络用于识别汽车的网络层的示例。从基本线开始,移动到轮子,再到车门和其他汽车部件,最后到整个车子。


过去,开发人员需要耗费大量的精力去提取出这些特征。而现在,只需要反复用大型数据集训练模型就可以了。当然,这其中也涉及到如何设计正确的架构以及准备训练数据等工作,但是不得不说,深度学习改变了我们构建世界模拟模型的方式。


执行器和推理


机器学习可以处理的问题很广泛,比如Facebook上识别朋友的照片,或者特斯拉的自动驾驶等。这些都是机器学习应用更加明显的例子,在这种情况下,我们可以直接和机器学习模型进行交互。因此,我们大多数人认为机器学习实际上是一种模型,与自动化相结合。我们运行模型,它就可以帮我们理解新的数据,比如朋友的照片,推荐电饭煲,或者自动驾驶。


这里我介绍两个人的见解:


第一个是Yonatan Zunger,他最近将人工智能描述为由三部分组成 1)用于收集数据的传感器;2)分析和解释数据的模型;3)将模型转换为结果的执行器。

第二个人是Michael Copeland,他概述了两种类型的硬件芯片 1)为构建模型的训练芯片;2)为使用模型分析新数据的推理芯片。例如,通过使用数百万张猫的图片来训练图像识别模型,这需要训练芯片。一旦模型训练成功,就可以对它进行优化,并投入实际应用,这时候需要推理芯片。


总结


简而言之,可以把机器学习看作由大量数据推动的喷气式发动机。一旦你使用机器学习来建立一个统计模型,你就可以“启动”它,也就是说,通过允许它与新数据进行交互并从中推断出现实意义,让它发挥作用。


这样做的最有力的例子往往包括各种形式的自动化,使我们的事情变得更简单。我们似乎最喜欢的是那些为我们提供某种用户界面,允许我们与模型交互的界面。这可能意味着让我们更容易在Spotify上找到新音乐,找到你在谷歌照片上拍摄的每一张彩色玻璃照片,甚至击败世界冠军的Alpha Go。

推荐↓↓↓
人工智能与大数据
上一篇:一名软件工程师的机器学习初体验 下一篇:Uber 和通用拟开源自动驾驶可视化软件