啃书文学网

手机浏览器扫描二维码访问

第249章 离谱的技术(第2页)

在此之前的1992年,在更为普遍的情形下,施密德胡伯也曾在循环神经网络上提出一种类似的训练方法,并在实验中证明这一训练方法能够有效提高有监督学习的执行速度。

自深度学习出现以来,它已成为很多领域,尤其是在计算机视觉和语音识别中,成为各种领先系统的一部分。在通用的用于检验的数据集,例如语音识别中的TIMIT和图像识别中的ImageNet,Cifar10上的实验证明,深度学习能够提高识别的精度。与此同时,神经网络也受到了其他更加简单归类模型的挑战,支持向量机等模型在20世纪90年代到21世纪初成为过流行的机器学习算法。

硬件的进步也是深度学习重新获得关注的重要因素。高性能图形处理器的出现极大地提高了数值和矩阵运算的速度,使得机器学习算法的运行时间得到了显着的缩短。

由于脑科学方面的大量研究已表明人脑网络不是一个级联的结构,深度学习网络在2001年后正逐渐被更有潜力的基于脑模型的网络所替代。

深度学习的基础是机器学习中的分散表示(distributedrepresentation)。分散表示假定观测值是由不同因子相互作用生成。在此基础上,深度学习进一步假定这一相互作用的过程可分为多个层次,代表对观测值的多层抽象。不同的层数和层的规模可用于不同程度的抽象。

深度学习运用了这分层次抽象的思想,更高层次的概念从低层次的概念学习得到。这一分层结构常常使用贪心算法逐层构建而成,并从中选取有助于机器学习的更有效的特征。

不少深度学习算法都以无监督学习的形式出现,因而这些算法能被应用于其他算法无法企及的无标签数据,这一类数据比有标签数据更丰富,也更容易获得。这一点也为深度学习赢得了重要的优势。

一部分最成功的深度学习方法涉及到对人工神经网络的运用。人工神经网络受到了1959年由诺贝尔奖得主大卫·休伯尔(DavidH.Hubel)和托斯坦·威泽尔(TorstenWiesel)提出的理论启发。休伯尔和威泽尔发现,在大脑的初级视觉皮层中存在两种细胞:简单细胞和复杂细胞,这两种细胞承担不同层次的视觉感知功能。受此启发,许多神经网络模型也被设计为不同节点之间的分层模型。

福岛邦彦提出的新认知机引入了使用无监督学习训练的卷积神经网络。扬·勒丘恩将有监督的反向传播算法应用于这一架构。

事实上,从反向传播算法自20世纪70年代提出以来,不少研究者都曾试图将其应用于训练有监督的深度神经网络,但最初的尝试大都失败。赛普·霍克赖特在其博士论文中将失败的原因归结为梯度消失,这一现象同时在深度前馈神经网络和循环神经网络中出现,后者的训练过程类似深度网络。在分层训练的过程中,本应用于修正模型参数的误差随着层数的增加指数递减,这导致了模型训练的效率低下。

为了解决这一问题,研究者们提出了一些不同的方法。于尔根·施密德胡伯于1992年提出多层级网络,利用无监督学习训练深度神经网络的每一层,再使用反向传播算法进行调优。在这一模型中,神经网络中的每一层都代表观测变量的一种压缩表示,这一表示也被传递到下一层网络。

另一种方法是赛普·霍克赖特和于尔根·施密德胡伯提出的长短期记忆神经网络(LSTM)。

2009年,在ICDAR2009举办的连笔手写识别竞赛中,在没有任何先验知识的情况下,深度多维长短期记忆神经网络获取了其中三场比赛的胜利。

斯文·贝克提出了在训练时只依赖梯度符号的神经抽象金字塔模型,用以解决图像重建和人脸定位的问题。

其他方法同样采用了无监督预训练来构建神经网络,用以发现有效的特征,此后再采用有监督的反向传播以区分有标签数据。杰弗里·辛顿等人于2006年提出的深度模型提出了使用多层隐变量学习高层表示的方法。这一方法使用斯摩棱斯基于1986年提出的受限玻尔兹曼机对每一个包含高层特征的层进行建模。模型保证了数据的对数似然下界随着层数的提升而递增。当足够多的层数被学习完毕,这一深层结构成为一个生成模型,可以通过自上而下的采样重构整个数据集。辛顿声称这一模型在高维结构化数据上能够有效地提取特征。

吴恩达和杰夫·迪恩领导的谷歌大脑团队创建了一个仅通过YouTube视频学习高层概念(例如猫)的神经网络。

其他方法依赖了现代电子计算机的强大计算能力,尤其是GPU。2010年,在于尔根·施密德胡伯位于瑞士人工智能实验室IDSIA的研究组中,丹·奇雷尚(DanCiresan)和他的同事展示了利用GPU直接执行反向传播算法而忽视梯度消失问题的存在。这一方法在扬·勒丘恩等人给出的手写识别MNIST数据集上战胜了已有的其他方法。

截止2011年,前馈神经网络深度学习中最新的方法是交替使用卷积层(convolutionallayers)和最大值池化层(max-poolinglayers)并加入单纯的分类层作为顶端。训练过程也无需引入无监督的预训练。从2011年起,这一方法的GPU实现多次赢得了各类模式识别竞赛的胜利,包括IJCNN2011交通标志识别竞赛和其他比赛。

这些深度学习算法也是最先在某些识别任务上达到和人类表现具备同等竞争力的算法。

深度神经网络是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。深度神经网络通常都是前馈神经网络,但也有语言建模等方面的研究将其拓展到循环神经网络。卷积深度神经网络(ConvolutionalNeuralNetworks,CNN)在计算机视觉领域得到了成功的应用。此后,卷积神经网络也作为听觉模型被使用在自动语音识别领域,较以往的方法获得了更优的结果。

其他神经网络模型类似,如果仅仅是简单地训练,深度神经网络可能会存在很多问题。常见的两类问题是过拟合和过长的运算时间。

深度神经网络很容易产生过拟合现象,因为增加的抽象层使得模型能够对训练数据中较为罕见的依赖关系进行建模。对此,权重递减或者稀疏等方法可以利用在训练过程中以减小过拟合现象。

另一种较晚用于深度神经网络训练的正规化方法是丢弃法(“dropout“regularization),即在训练中随机丢弃一部分隐层单元来避免对较为罕见的依赖进行建模。

我将败掉万亿家产张臻秋淑芬  孤岛上的平行世界III  贤者之王  我老婆是天后巨星  我在古代当神医颜循韩嫣  撼龙风水师  缠绵入骨,首席老公别过分  我,捡破烂成世界首富  战神入赘成首富齐昆仑谢芝真  始于心甘情愿纪初安  纪初安唐石谦重生文  我开局穿越三国战场造机甲  纪初安唐石谦重生文  鬼谷八荒之开局就是三剑痴  枭霸娇妻  少帅夫人不准逃顾婠婠霍沉离  我是文娱之王陈轩王玲  尊养小夫郎[种田]  野蛮匪夫的小娇娇  我没想当绿茶,真的(快穿)  

热门小说推荐
重生富二代之别动我爸

重生富二代之别动我爸

书海阁小说网免费提供作者一六的经典小说重生富二代之别动我爸最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说产品经理技术猿一觉醒来发现回到了上世纪90年代,自己还是一个可爱的萌娃。而自己本来已经破产的老爹还壮志凌云,为了自己能过上富二代,躺着数钱的美好日子,他不得不动用一切本事装逼,然后顺便帮自己老爹成功。...

战神狂婿

战神狂婿

五年前,他是落魄贵族,被疯狂追杀。五年后,他是震慑全球的无上战神,更是被称为地下世界的嗜血冥王!如今载誉归来,却娶了亚洲第一富婆兼美女。女主李不凡,你就是个窝囊废,你配不上我,永远别想让我爱上你!几个月后,女主不凡,求求你跟我结婚吧,我给你生孩子,几个都行...

隐婚蜜爱:墨少,宠上瘾!

隐婚蜜爱:墨少,宠上瘾!

人生中第一次喝的烂醉如泥,醒来成了有夫之妇。人生中第二次喝的烂醉如泥,醒来失了身。楚微俏人生中最后悔的事,就是被喝酒误事。墨庭深将她抵在床头,唇角邪魅勾起,宝贝,你说过不后悔嫁给我。楚微俏瑟瑟发抖,嗯,她是不敢后悔啊!...

今夜难眠

今夜难眠

今夜难眠作者陈进童望君今夜难眠txt下载一觉醒来,结了婚,有位漂亮的妻子,还有两个女儿,妻子却跟我提出这样的要求...

医师

医师

本书不讲中医,只谈西医。本书同样有未来的一个神奇的医生辅助系统。本书没有装了个系统便成专家的情节,也没有什么病都能治的设定,要成大神,主角的路非常漫长。这只是一个普通人得到了一个不普通的系统之后,成为一名优秀医师的故事。...

都市神婿

都市神婿

有人问世人谤我欺我辱我笑我轻我贱我恶我骗我,该当如何佛曰只需忍他让他由他避他耐他敬他不要理他再待几年你且看他。某赘婿全是扯淡,小爷可没有这么好的脾气,以血还血,以牙还牙。...

每日热搜小说推荐