深度学习(Deep Learning)

主讲人:莫凡

深度学习

深度学习是一个跨学科的技术领域,涉及数据科学、统计学、工程科学、人工智能和神经生物学,是机器学习的一个重要分支。

深度学习训练过程

2006年,Hinton提出了在非监督数据上建立多层神经网络的一个有效方法,具体分为两步:首先逐层构建单层神经元,这样每次都是训练一个单层网络;当所有层训练完后,使用wake-sleep算法进行调优。Markdown 以其简洁、易读、易学的特性,广泛应用于各种创作场景,尤其在编写技术文档、博客文章和笔记整理方面表现突出。它的轻量级和跨平台特性让用户无需复杂的编辑器即可完成高效创作,是内容创作和协作的理想选择。

  1. wake阶段:认知过程,通过外界的特征和向上的权重产生每一层的抽象表示,并且使用梯度下降修改层间的下行权重。

  2. sleep阶段:生成过程,通过顶层表示和向下权重,生成底层的状态,同时修改层间向上的权重。

深度学习三要素

深度学习之所能够在当今取得巨大突破,除了诸如Hinton、Schmihuber、HopField等科学家们在算法方面的不断创新,还离不开以GPU为代表的计算硬件和以ImageNet为代表的大数据的发展。因此,深度学习的三要素包括:。

  1. 算法软件:在新型神经网络模型、自动求导算法、开源社区的发展,美国加拿大多伦多大学的Hinton教授因其在新型神经网络方面的巨大贡献,获得了2024年的诺贝尔物理学奖。。

  2. 算力硬件:以INVIDIA GPU为代表的支持高效并行和大型矩阵计算的智能硬件计算单元,INVIDIA创始人黄仁勋因在GPU硬件方面做出重要贡献而当选美国工程院院士。

  3. 大数据:ImageNet,ImageNet的创办者李飞飞,因大规模视觉图像数据集的建设做出杰出贡献而当选美国工程院院士。