啃书文学网

手机浏览器扫描二维码访问

第249章 离谱的技术(第2页)

在此之前的1992年,在更为普遍的情形下,施密德胡伯也曾在循环神经网络上提出一种类似的训练方法,并在实验中证明这一训练方法能够有效提高有监督学习的执行速度。

自深度学习出现以来,它已成为很多领域,尤其是在计算机视觉和语音识别中,成为各种领先系统的一部分。在通用的用于检验的数据集,例如语音识别中的TIMIT和图像识别中的ImageNet,Cifar10上的实验证明,深度学习能够提高识别的精度。与此同时,神经网络也受到了其他更加简单归类模型的挑战,支持向量机等模型在20世纪90年代到21世纪初成为过流行的机器学习算法。

硬件的进步也是深度学习重新获得关注的重要因素。高性能图形处理器的出现极大地提高了数值和矩阵运算的速度,使得机器学习算法的运行时间得到了显着的缩短。

由于脑科学方面的大量研究已表明人脑网络不是一个级联的结构,深度学习网络在2001年后正逐渐被更有潜力的基于脑模型的网络所替代。

深度学习的基础是机器学习中的分散表示(distributedrepresentation)。分散表示假定观测值是由不同因子相互作用生成。在此基础上,深度学习进一步假定这一相互作用的过程可分为多个层次,代表对观测值的多层抽象。不同的层数和层的规模可用于不同程度的抽象。

深度学习运用了这分层次抽象的思想,更高层次的概念从低层次的概念学习得到。这一分层结构常常使用贪心算法逐层构建而成,并从中选取有助于机器学习的更有效的特征。

不少深度学习算法都以无监督学习的形式出现,因而这些算法能被应用于其他算法无法企及的无标签数据,这一类数据比有标签数据更丰富,也更容易获得。这一点也为深度学习赢得了重要的优势。

一部分最成功的深度学习方法涉及到对人工神经网络的运用。人工神经网络受到了1959年由诺贝尔奖得主大卫·休伯尔(DavidH.Hubel)和托斯坦·威泽尔(TorstenWiesel)提出的理论启发。休伯尔和威泽尔发现,在大脑的初级视觉皮层中存在两种细胞:简单细胞和复杂细胞,这两种细胞承担不同层次的视觉感知功能。受此启发,许多神经网络模型也被设计为不同节点之间的分层模型。

福岛邦彦提出的新认知机引入了使用无监督学习训练的卷积神经网络。扬·勒丘恩将有监督的反向传播算法应用于这一架构。

事实上,从反向传播算法自20世纪70年代提出以来,不少研究者都曾试图将其应用于训练有监督的深度神经网络,但最初的尝试大都失败。赛普·霍克赖特在其博士论文中将失败的原因归结为梯度消失,这一现象同时在深度前馈神经网络和循环神经网络中出现,后者的训练过程类似深度网络。在分层训练的过程中,本应用于修正模型参数的误差随着层数的增加指数递减,这导致了模型训练的效率低下。

为了解决这一问题,研究者们提出了一些不同的方法。于尔根·施密德胡伯于1992年提出多层级网络,利用无监督学习训练深度神经网络的每一层,再使用反向传播算法进行调优。在这一模型中,神经网络中的每一层都代表观测变量的一种压缩表示,这一表示也被传递到下一层网络。

另一种方法是赛普·霍克赖特和于尔根·施密德胡伯提出的长短期记忆神经网络(LSTM)。

2009年,在ICDAR2009举办的连笔手写识别竞赛中,在没有任何先验知识的情况下,深度多维长短期记忆神经网络获取了其中三场比赛的胜利。

斯文·贝克提出了在训练时只依赖梯度符号的神经抽象金字塔模型,用以解决图像重建和人脸定位的问题。

其他方法同样采用了无监督预训练来构建神经网络,用以发现有效的特征,此后再采用有监督的反向传播以区分有标签数据。杰弗里·辛顿等人于2006年提出的深度模型提出了使用多层隐变量学习高层表示的方法。这一方法使用斯摩棱斯基于1986年提出的受限玻尔兹曼机对每一个包含高层特征的层进行建模。模型保证了数据的对数似然下界随着层数的提升而递增。当足够多的层数被学习完毕,这一深层结构成为一个生成模型,可以通过自上而下的采样重构整个数据集。辛顿声称这一模型在高维结构化数据上能够有效地提取特征。

吴恩达和杰夫·迪恩领导的谷歌大脑团队创建了一个仅通过YouTube视频学习高层概念(例如猫)的神经网络。

其他方法依赖了现代电子计算机的强大计算能力,尤其是GPU。2010年,在于尔根·施密德胡伯位于瑞士人工智能实验室IDSIA的研究组中,丹·奇雷尚(DanCiresan)和他的同事展示了利用GPU直接执行反向传播算法而忽视梯度消失问题的存在。这一方法在扬·勒丘恩等人给出的手写识别MNIST数据集上战胜了已有的其他方法。

截止2011年,前馈神经网络深度学习中最新的方法是交替使用卷积层(convolutionallayers)和最大值池化层(max-poolinglayers)并加入单纯的分类层作为顶端。训练过程也无需引入无监督的预训练。从2011年起,这一方法的GPU实现多次赢得了各类模式识别竞赛的胜利,包括IJCNN2011交通标志识别竞赛和其他比赛。

这些深度学习算法也是最先在某些识别任务上达到和人类表现具备同等竞争力的算法。

深度神经网络是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。深度神经网络通常都是前馈神经网络,但也有语言建模等方面的研究将其拓展到循环神经网络。卷积深度神经网络(ConvolutionalNeuralNetworks,CNN)在计算机视觉领域得到了成功的应用。此后,卷积神经网络也作为听觉模型被使用在自动语音识别领域,较以往的方法获得了更优的结果。

其他神经网络模型类似,如果仅仅是简单地训练,深度神经网络可能会存在很多问题。常见的两类问题是过拟合和过长的运算时间。

深度神经网络很容易产生过拟合现象,因为增加的抽象层使得模型能够对训练数据中较为罕见的依赖关系进行建模。对此,权重递减或者稀疏等方法可以利用在训练过程中以减小过拟合现象。

另一种较晚用于深度神经网络训练的正规化方法是丢弃法(“dropout“regularization),即在训练中随机丢弃一部分隐层单元来避免对较为罕见的依赖进行建模。

纪初安唐石谦重生文  枭霸娇妻  野蛮匪夫的小娇娇  孤岛上的平行世界III  我是文娱之王陈轩王玲  我,捡破烂成世界首富  我在古代当神医颜循韩嫣  始于心甘情愿纪初安  贤者之王  尊养小夫郎[种田]  撼龙风水师  我老婆是天后巨星  缠绵入骨,首席老公别过分  少帅夫人不准逃顾婠婠霍沉离  我开局穿越三国战场造机甲  我将败掉万亿家产张臻秋淑芬  纪初安唐石谦重生文  战神入赘成首富齐昆仑谢芝真  我没想当绿茶,真的(快穿)  鬼谷八荒之开局就是三剑痴  

热门小说推荐
她是一只猫头鹰

她是一只猫头鹰

书海阁小说网免费提供作者漪岚十四的经典小说她是一只猫头鹰最新章节全文阅读服务本站更新及时无弹窗广告欢迎光临wwwshgtw观看小说来自月亮的猫头鹰少女苏夜在人间寻找丢失的月魇之茧,意外成为某高校一品校草的宠物。从此开启了保护校草,为校草洗衣做饭,打梦魇的女仆生涯。但是好心没好报...

至尊龙图腾

至尊龙图腾

在这个天地万物皆可成为信仰的图腾世界,武者可以通过燃烧气血从所信仰的图腾获得力量,图腾祭师更是能够沟通信仰图腾来获得通天之力!一个拥有天地间第一神体的少年,在偶然得到家族所信仰的龙图腾吊坠之后,会在这个世界掀起怎样的狂澜呢?老鼠的第六本小说,希望大家会喜欢。...

前夫高攀不起

前夫高攀不起

前夫高攀不起本文已签约出版,质量保证,放心入坑容颜在一片羡慕声中,嫁给了林家二少。却不知,新婚夜,他就送给她一个奇耻大辱,让她无颜回门他在被逼无奈之下娶了容家大小姐。外界传闻,她是容家私生女,为了回到容家,她不惜害死了自己的母亲,才有了现在容家三小姐的身份。他以为她就是这么一个爱慕虚荣的女人。所以娶她进门,用鄙夷的态度等着看好戏。却没想到只等来她的漠视三天后,她作为律师,冷静自若的对他说,林先生,作为陈小姐的律师,我为我的当事人,控告先生对我当事人采取了强制胁迫的方法,希望达到违背被害人意志发生xìng关系的行为,也就是通俗意义上的所指的强jiān未遂!希望林先生能配合我的工作。他第一次知道世界上还有这种女人!她从不奢求自己的婚姻会被人祝福,因为在这一个爱情故事里,她永远是那个被诅咒的恶毒...

菜鸟团

菜鸟团

得了网络病乙型病症的患者将禁止进入游戏,因为他们会给游戏带来BUG,严重者更是可以直接伤害其他游戏玩家的身体。直到全新的网游穿越降临,它带着全新的技术,并宣称所有人都可以游戏!邹渲作为乙型病患者,从来没有接触过游戏,如今他这个毫无经验的菜鸟将会第一次踏上游戏,开启他的游戏人生。...

嫡女为凰:重生王妃有点凶

嫡女为凰:重生王妃有点凶

作者路菲汐的经典小说嫡女为凰重生王妃有点凶最新章节全文阅读服务本站更新及时无弹窗广告小说一场冤案,害她家破人亡。重生十年前,侯府孤女逆天改命。却不知怎么惹上摄政王,非得抢她做王妃?楚曦玉世人都道我心狠手辣,六亲不认,盛京第一祸水。你怎么非看上我?摄政王世人还道本王祸乱朝纲,无恶不作,盛京第一奸臣。你我岂不是天作之合?女强男强,甜宠无虐。...

每日热搜小说推荐