51CTO首页
AI.x社区
博客
学堂
精品班
直播训练营
企业培训
鸿蒙开发者社区
WOT技术大会
AIGC创新中国行
IT证书
公众号矩阵
移动端

深度学习的难点:神经网络越深,优化问题越难

人工智能 深度学习 移动开发
深度学习的核心问题就是一个非常难的优化问题。所以在神经网络引入后的几十年间,深度神经网络的优化问题的困难性是阻碍它们成为主流的一个重要因素。并导致了它们在20世纪90年代到21世纪初期间的衰落。

[[192056]]

深度学习的核心问题就是一个非常难的优化问题。所以在神经网络引入后的几十年间,深度神经网络的优化问题的困难性是阻碍它们成为主流的一个重要因素。并导致了它们在20世纪90年代到21世纪初期间的衰落。不过现在已经基本解决了这个问题。在本篇博文中,我会探讨优化神经网络的“困难性”,以及理论上是怎么解释这个问题的。简而言之:神经网络变得越深,优化问题就会变得越难。

最简单的神经网络是单节点感知器,其优化问题是凸问题。凸优化问题的好处是所有的局部最小值也是全局最小值。存在各种各样的优化算法来解决凸优化问题,并且每隔几年就会发现更好的用于凸优化的多项式时间的算法。使用凸优化算法可以轻松地优化单个神经元的权重(参见下图)。下面让我们看看扩展一个单神经元后会发生什么。

图1 左图:一个凸函数。右图:一个非凸函数。凸函数比非凸函数更容易找到函数曲面的底部(来源:Reza Zadeh)

下一步自然就是在保持单层神经网络的情况下添加更多的神经元。对于单层n节点感知器的神经网络,如果存在边权重可以使得神经网络能正确地对训练集进行分类,那么这样的边权重是可以通过线性规划在多项式时间O(n)内找到。线性规划也是凸优化的一种特殊情况。这时一个问题应运而生:我们可以对更深的多层神经网络做出这种类似的保证么?不幸的是,不能。

为了可证明地解决两层或多层的一般神经网络的优化问题,需要的算法将会遇到某些计算机科学中***的未解问题。因此我们对机器学习研究人员尝试找到可证明地解决深度神经网络优化问题的算法不抱有太大的希望。因为这个优化问题是NP-hard问题,这意味着如果在多项式时间内可证明地解决这个问题,那么也可以解决那些几十年来尚未被解决的成千上万的问题。事实上,J. Stephen Judd在1988年就发现下面这个问题是NP-hard问题:

给定一个一般的神经网络和一组训练样本,是否存在一组网络边权重使得神经网络能为所有的训练样本产生正确的输出?

Judd的研究还表明:即使要求一个神经网络只为三分之二的训练样本产生正确的输出仍然是一个NP-hard问题。这意味着即使在最坏的情况下,近似训练一个神经网络在本质上还是困难的。1993年Blum和Rivest发现的事实更糟:即使一个只有两层和三个节点的简单神经网络的训练优化问题仍然是NP-hard问题。

理论上,深度学习与机器学习中的很多相对简单的模型(例如支持向量机和逻辑回归模型)的区别在于,这些简单模型可以数学证明地在多项式时间内完成模型优化。对于这些相对简单的模型,我们可以保证即使用运行时间比多项式时间更长的优化算法也都不能找到更好的模型。但是现有的深度神经网络的优化算法并不能提供这样的保证。在你训练完一个深度神经网络模型之后,你并不知道这个网络模型是否是在你的当前配置下能找到的***的一个模型。所以你会存有疑虑,如果继续训练模型的话是否可以得到一个更好的模型。

幸运的是我们在实践中可以非常高效地接近这些***结果:通过运行经典的梯度下降优化方法就可以得到足够好的局部最小值,从而可以使我们在许多常见问题上取得巨大进步,例如图像识别、语音识别和机器翻译。我们简单地忽略***结果,并在时间允许的情况下尽可能多地进行梯度下降迭代。

似乎传统的优化理论结果是残酷的,但我们可以通过工程方法和数学技巧来尽量规避这些问题,例如启发式方法、增加更多的机器和使用新的硬件(如GPU)。一些研究工作正在积极地探索为什么理论结果很残酷,但这些经典的优化算法却工作得这么好。

责任编辑:林师授 来源: 大数据文摘
相关推荐
机器学习深度学习神经网络之间区别
在本文中,我将介绍机器学习、深度学习和神经网络之间的区别,以及它们之间的关系。让我们从定义这些术语开始。

2023-04-19 10:17:35

机器学习 深度学习
深度学习神经网络预测间隔
通常,用于回归问题的预测模型(即预测数值)进行点预测。这意味着他们可以预测单个值,但不能提供任何有关该预测的不确定性的指示。根据定义,预测是估计值或近似值,并且包含一些不确定性。

2021-03-29 09:02:24

深度学习 预测 间隔
深度学习入门课程笔记 神经网络
神经网络能表达多复杂的数据信息是由什么决定的呢这个例子给了咱们很好的解释,神经网络是表达能力是由神经元的个数,也就是每一个隐层所函数神经元的个数来决定的,神经元越多,层数越深表达的能力也就越强,理论上我们认为神经元越多越好!

2016-12-27 14:24:57

课程 笔记 神经网络
神经网络越深,表现就一定越好吗?
数十层甚至数百层神经网络的应用,是深度学习的重要标志之一。但现实情况却远非如此:比如今年被视作机器学习领域最火热的研究方向之一——图神经网络,大多数都只运用了寥寥几层网络。

2020-08-07 15:26:45

神经网络 深度学习 机器学习
神经网络如何学习
毫无疑问,神经网络是目前使用的最流行的机器学习技术。所以我认为了解神经网络如何学习是一件非常有意义的事。

2020-08-06 10:11:13

神经网络 机器学习 算法
深度学习神经网络之图像分类应用实战
深度学习神经网络是魔法,还是线性代数和微积分更有魔力?本文将通过一个图像分类深度学习神经网络的实战案例来回答这个问题。

2023-02-28 08:00:00

深度学习 神经网络 人工智能
卷积神经网络性能优化
本文首先定义卷积神经网络的概念,继而简要介绍几种常见的优化方法,并讨论作者在该领域的一些经验。

2022-04-07 09:01:52

神经网络 人工智能
深度学习系列】卷积神经网络详解(二)——自己手写一个卷积神经网络
上篇文章中我们讲解了卷积神经网络的基本原理,包括几个基本层的定义、运算规则等。本文主要写卷积神经网络如何进行一次完整的训练,包括前向传播和反向传播,并自己手写一个卷积神经网络。

2018-04-08 11:20:43

深度学习
深度学习神经网络:实现复杂任务AI模型
在人工智能领域,深度学习和神经网络已经成为最引人注目的技术之一。通过模拟人类大脑的工作方式,这些技术使计算机能够从数据中自动学习和提取模式,从而实现各种复杂任务。

2023-09-03 14:17:56

深度学习 人工智能
动物与人类关键学习期,深度神经网络也有
我们这篇文章讨论的问题是根据ICLR2019中的一篇文章而来:《CRITICALLEARNINGPERIODSINDEEPNETWORKS》。

2021-07-07 10:57:08

神经网络 AI 算法
可用于自动驾驶神经网络深度学习
高级辅助驾驶系统(ADAS)可提供解决方案,用以满足驾乘人员对道路安全及出行体验的更高要求。诸如车道偏离警告、自动刹车及泊车辅助等系统广泛应用于当前的车型,甚至是功能更为强大的车道保持、塞车辅助及自适应巡航控制等系统的配套使用也让未来的全自动驾驶车辆成为现实。

2017-03-07 13:55:30

自动驾驶 神经网络 深度学习
训练深度学习神经网络常用五个损失函数
神经网络在训练时的优化首先是对模型的当前状态进行误差估计,然后为了减少下一次评估的误差,需要使用一个能够表示错误函数对权重进行更新,这个函数被称为损失函数。

2022-10-17 15:43:14

深度学习 回归模型 函数
深度神经网络为何很难训练?
实际上,在某种程度上看,他们的客户并没有太疯狂。假设你可以使用某种特殊的逻辑门,它让你对任意多的输入做AND运算。同样也能使用多输入的NAND门——可以对多个输入做AND运算并取负的门。有了这类特殊的门,构建出来的两层深度的电路可以计算任何函数。

2017-12-22 08:47:41

神经网络 AND 运算
深度神经网络深度究竟带来了什么?
人工智能近几年实现了爆炸式发展,深度学习可以说是其主要的推动力。笔者对于能来微软实习并从事深度学习方面的研究感到十分荣幸,因为微软研究院在该领域一直处于领先的地位,其优秀的人才配备和强大的计算资源都非常适合做这方面的研究。

2017-03-22 11:59:40

深度 神经 网络
深度学习之父Hinton:下一代神经网络
人工神经网络最重要的未解难题之一,是如何像大脑一样有效地进行无监督学习。

2020-09-18 17:52:10

神经网络 数据 图形
一文理清深度学习前馈神经网络
前馈神经网络(feedforwardneuralnetwork)是一种最简单的神经网络,各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。

2019-11-06 17:00:51

深度学习 神经网络 人工智能
TensorFlow学习神经网络构建
本文带你通过TensorFlow学习神经网络的构建,包括建立一个神经网络添加层、训练一个二次函数等,并且有完整代码。

2018-03-22 13:34:59

TensorFlow 神经网络
人工智能/机器学习/深度学习/神经网络:有什么区别?
人工智能术语通常可以互换使用,但它们并不相同。阅读下文了解人工智能、机器学习和深度学习、神经网络之间的区别。

2023-11-15 16:12:41

人工智能 机器学习 深度学习
深度学习工作原理:窥视驱动今日AI神经网络内部
今天人工智能的繁荣离不开一种名为深度学习的技术,该技术基于人工神经网络。本文通过图形解释了如何构建和训练这些神经网络。

2021-10-15 08:00:00

人工智能 深度学习 技术
深度学习神经网络:最值得关注6大趋势
神经网络的基本思想是模拟计算机“大脑”中多个相互连接的细胞,这样它就能从环境中学习,识别不同的模式,进而做出与人类相似的决定。

2018-09-13 22:22:48

深度学习 神经网络 人工智能

深圳SEO优化公司廊坊网站建设推荐西安seo网站推广大理网站制作推荐防城港网站关键词优化哪家好新余网站优化软件江门网站优化按天计费报价濮阳网站推广方案报价海南推广网站多少钱临沂营销网站大理推广网站陇南网站设计价格贵港企业网站制作多少钱蚌埠网站seo优化报价桂林设计公司网站报价德州网站建设推荐吉安SEO按效果付费公司景德镇网站开发价格张家界高端网站设计报价阜阳网站关键词优化价格广东百度竞价包年推广喀什网站优化按天计费价格营口至尊标王推荐广州关键词按天计费哪家好焦作阿里店铺托管报价莱芜百姓网标王报价延边网站设计多少钱沈阳seo网站推广公司邢台网站seo优化推荐黔南至尊标王价格晋中seo歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化