发展历程一览:深度学习离你并不远

AI中国    05-18 17:14

1997年,世界国际象棋冠军加里·卡斯帕罗夫对阵一个位“默默无闻”却异常强大的对手——IBM的(巨型)超级计算机“深蓝”。

发展历程一览:深度学习离你并不远

在原先的比赛中加里都击败了对手。但是,1997年5月11日的比赛加里输了,“深蓝”成为了冠军。

“深蓝”是第一个在正规比赛中击败世界冠军的计算机程序。

这次比赛吸引了全世界的目光,“深蓝”为人工智能的发展奠定了不可估量基础。同时,数据科学家和软件工程师开始研究深度学习这个相对未知的领域。

在2018年,深度学习成为了一个热门词汇。根据Gartner的研究显示,深度学习已经不属于创新发展阶段,它步入了人们所预期的顶峰阶段。

发展历程一览:深度学习离你并不远

深度学习这一理念还未成为当今社会的主流。然而,与深度学习相关的应用已经渗透到了我们生活的方方面面。

本文是深度学习的入门读物。在这篇文章里,作者试图对基本概念提供一个简单的解释,讨论其产生的原因,并共同探讨深度学习的一些实际应用。

概念

我们首先对人工智能领域中的深度学习进行分类。

发展历程一览:深度学习离你并不远

如上图所示,深度学习是机器学习的一个子集。机器学习是人工智能(AI)的子集。而人工智能是机器智能化的领域。

基于规则的系统

发展历程一览:深度学习离你并不远

现在我们做一个能够识别电信公司客户流失情况的系统。

方法一:制定一个能识别客户流失情况的系统。通过它找出那些流失的客户。(这是一项艰巨的任务。)大量的因素以及不同的排列组合会给系统带来难以言明的影响。这加剧了系统的不确定性,比如说客户资料的变化或商业模式的变化,都会给系统带来影响。

发展历程一览:深度学习离你并不远

方法二:创建统计学习模型。它会从已流失的客户信息中进行学习。然后生成特定“特征”,它们会判断这些“特征”是否影响了客户的流失。

要注意的是,这种机器学习模型会过于依赖人类提供的输入样本。为了使模型有效,输入的样本必须有效。而这也给建模者的直觉和对该领域知识的储备提出了更高的要求。

深度学习系统

发展历程一览:深度学习离你并不远

显示的数据与预期输出一致时,传统的机器学习模型就可以正常工作了。然而,要考虑的是,由于潜在特征的数量增加,识别正确的输入特征就成为了一项挑战。所以,在传统的机器学习模型开发中,大量时间都花费在了对特征的建设上。比如说客户流失的例子中,影响客户流失的因素不止一种。其中一些是未知的,还有一些特性是派生的。

如果这些特征可以自动学习会怎样?有解决的方案吗?

作者认为,深度学习是关键。系统基于深度学习,自动识别导致客户流失的相关特征,进而帮助人们获得正确的数据。

自动学习特征的过程被称为表现性学习。

神经网络:深度学习系统的基石

基于深度学习的系统会自动学习相关特征以解决机器学习任务。

在这里,需要补充的是,许多简单的互相连接的节点组成了神经网络。神经网络的机器学习算法构建了深度学习网络。深度神经网络又是深度学习的基础算法。

发展历程一览:深度学习离你并不远

深度神经网络有三种层次:

输入层:流或输入数据点隐藏层:与输入点互相连接的处理节点。一个深度神经网络具有两个以上的隐藏层。输出层:将处理后的信息转换为可用输出的节点。

在从简单到复杂的模式识别中,神经网络先在网络的第一层学习简单的特征,一些节点根据定义的阈值被激活。这些被激活的节点会输入到后续的网络层中。以此类推,这是一个将简单特征组合起来以获得复杂特征的过程。这个过程将不断重复,直到计算出输出层中最终输出的结果。

深度学习并非刚刚诞生。为什么现在才流行起来?

深度学习的兴起

1943年,Warren McCulloch写了一篇关于神经元的论文。然而,受到以下两个因素的限制,神经网络发展备受阻碍:缺乏大量可用的数据来训练深度神经网络。训练深度神经网络需要大量的计算能力。

随着大数据和云计算的出现,这些问题迎刃而解。

发展历程一览:深度学习离你并不远

如上图所示,自2000年以来,计算能力增加了10,000倍,存储数据的成本也下降了大约3000倍。由于互联网的崛起,智能手机革命和社交媒体的兴起,数据的创建数量呈指数级增长。数据无处不在。这三个要素为深度学习创造了一个完美的环境。人们重新燃起了对深度学习的研究的兴趣。

主要应用

事实证明,深度学习可以帮助人们执行一些工作或任务。比如说,图像识别、语音翻译等。深度学习擅于识别图像中的图案或识别特定的对象。也擅于处理语言,理解并对它们做出区分。总的来说,深度学习被广泛使用于:

计算机视觉

计算机视觉是一个跨学科领域,深度学习负责对图像的理解。

比如说,对象识别:对图像或视频流中的对象进行分类。人脸识别:在图像或视频流中进行人脸识别。

自然语言处理

自然语言处理是将计算技术应用于自然语言(或语音)的分析与合成。

在2018年1月,深度学习在语音识别领域击败了人类。根据斯坦福问答数据集的内容,微软和阿里巴巴的语音识别模型比人类更出色。

一些使用语音识别的应用程序是:语音识别:对人类语言的识别。意图识别:识别对话或文本中的人的意图(目的)。语音到文本/文本到语音的转换:将语音转换为文本,或者相反。

结论

在这篇文章中,作者谈到了深度学习的核心组成部分,讨论了它增长的原因以及它主要应用于哪些方面。

深度学习是人工智能兴起的核心,它是一个前景广阔的领域。未来几年,它将继续得到越来越多的采用。深度学习应用程序也将继续改变我们生活的世界。

棋牌

网站地图