注:封面画师:新雨林-触站

说明

  • 本页面无手机端适配,强制缩放阅读。
  • 使用纯html格式,保存教学用ppt,添加了部分个人笔记。
  • 目录工作正常,可以跳转。

background image

深度学习概述

深度学习概述

引入

深度学习巨大影响

人工智能划时代事件

什么是深度学习

深度神经网络

深度学习与机器学习的关系

深度学习的定义

深度学习的特点

深度学习的应用

深度学习的优点

深度学习的缺点

深度学习与机器学习对比

课程内容与特点

为什么要学习深度学习

深度学习发展史

深度学习的特点

深度学习的应用

课程内容

课程特点

学习资源推荐

深度学习发展简史

深度网络演化过程

引入


background image




人工智能划时代事件

• 2016年3月,Google公司研发的AlphaGo以

4:1击败世界围棋顶级选手李世石。次年,
AlphaGo2.0对战世界最年轻的围棋四冠王柯洁,
以3:0击败对方。背后支撑AlphaGo具备如此强
大能力的,就是“深度学习”(Deep 
Learning)。

• 一时间,“深度学习”这个本专属于计算机学

科的术语,成为包括学术界、工业界、风险投
资界等众多领域的热词。


background image




深度学习巨大影响

• 除了博弈,深度学习在计算机视觉(computer vision)、语音识别、自

动驾驶等领域,表现与人类一样好,甚至有些地方超过了人类。

2013年

深度学习就被麻省理工学院的《MIT科技评论》

评为世界10大突破性技术

之一。

• 深度学习不仅是一种算法升级,还是一种全新的思维方式,它的颠覆性在

于,将人类过去痴迷的算法问题,演变成数据和计算问题,

以前“算法为

核心竞争力”正在转换为“数据为核心竞争力”

深度学习的定义


background image




什么是深度学习

• 简单来说,

深度学习就是一种包括多个隐含层(越多即为越深)的

多层感知机。它通过组合低层特征,形成更为抽象的高层表示,用
以描述被识别对象的高级属性类别或特征。

能自生成数据的中间表

示(虽然这个表示并不能被人类理解),是深度学习区别于其它机
器学习算法的独门绝技。

• 所以,深度学习可以总结成:

通过加深网络,提取数据深层次特征


background image




深度神经网络

• 深度神经网络(及其变种)是深度学习中心模型


background image




深度学习与机器学习的关系

• 人工智能学科体系


background image




深度学习与机器学习的关系(续)

• 人工智能、机器学习、深度学习三者的关系,可以认为深度学习是

机器学习的“高级阶段”

深度学习的特点


background image




深度学习的特点

• 优点

Ø  性能更优异

Ø  不需要特征工程

Ø  在大数据样本下有更好的性能

Ø  能解决某些传统机器学习无法解决的问题

• 缺点

Ø  小数据样本下性能不如机器学习

Ø  模型复杂

Ø  过程不可解释


background image




深度学习的优点

• 性能更优异

下图是历年ImageNet大规模视觉识别挑战(ILSVRC)的分类精度,其中蓝色是传统
机器学习方法,其它为深度学习方法。2015年比赛成绩,识别率超过了人类


background image




深度学习的优点(续1)

• 性能更优异

在语音识别领域,进入深度学习时代
后,识别率有了明显的提高

Ø

2015 Google:错误率8%

Ø

IBM Watson智能系统:错误率
6.9%

Ø

2016年9月 微软:错误率6.3%

近20年来语音识别错误率的下降趋势图


background image




深度学习的优点(续2)

• 优点2:不需要特征工程

传统机器学习需要人进行特征提取(特征工程),机器性能高度依赖
于特征工程的质量。在特征很复杂的情况下,人就显得无能为力。

深度学习不需要这样的特征工程,只需将数据直接传递给深度学习网
络,由机器完成特征提取。


background image




深度学习的优点(续3)

• 深度学习在大样本数据下有更好的性能和扩展性

数据量

性能

传统机器学习

小型神经网络

中型神经网络

大型神经网络


background image




深度学习的优点(续4)

• 深度学习能解决传统机器学习无法解决的问题(如深层次

特征提取)


background image




深度学习的缺点

• 深度学习在小数据上性能不如传统机器学习
• 深度学习网络结构复杂、构建成本高
• 相比传统机器学习,深度学习可解释性较差


background image




深度学习与传统机器学习对比

• 相同点

Ø

目的相同:都是利用机器自我学习能力,解决软件系统的难题

Ø

基本问题相同:回归问题、分类问题、聚类问题

Ø

基本流程相同:数据准备 --> 模型选择 --> 模型构建/训练 --> 模型评估 --> 预测

Ø

问题领域相同

ü

样本是否有标签:监督学习、非监督学习、半监督学习

ü

应用领域:推荐引擎、计算机视觉、自然语言处理、强化学习

Ø

评价标准相同

Ø

回归问题:均方误差;R2值

Ø

分类问题:交叉熵;查准率、召回率、F1综合系数

Ø

模型泛化能力:过拟合、欠拟合


background image




深度学习与传统机器学习对比(续)

比较项

传统机器学习

深度学习

特征提取

人提取特征(特征工程)

模型提取特征

性能(准确度/精度)

可解释性

训练数据

模型结构

简单

复杂

• 不同点


background image




为什么要学习深度学习

• 深度学习具有更强的解决问题能力(例如图像识别准确率明显超过

机器学习,甚至超过了人类)

• 掌握深度学习具有更强的职业竞争力
• 深度学习在行业中应用更广泛

深度学习的应用


background image




深度学习的应用

• 照片上色

老照片上色


background image




• 换脸

人脸更换

深度学习的应用(续1)


background image




• 图像风格转换

生成毕加索、梵高、莫奈风格的蒙娜丽莎

深度学习的应用(续2)


background image




深度学习的应用(续3)

• 虚拟主播

采用语音图像合成技术虚拟的新闻主播


background image




深度学习的应用(续4)

• 声音模仿

机器模仿歌星声音


background image




深度学习的应用(续5)

图像分类

人脸识别

自动驾驶

机器博弈

自然语言处理

机器人

语音处理

图像迁移

课程内容与特点


background image





background image




课程特点

• 概念术语多,理论复杂,学习曲线陡峭,需要长期、反复学习、

理解、体会、实践

• 需要部分数学知识(记住结论、会使用API、理解公式、推导

过程)

• 案例复杂度高
• 与传统程序差异较大


background image




学习资源推荐

张玉宏 电子工业出版社

斋藤康毅 工信出版社

Ian Goodfellow、Yoshua 

Bengio、Aaron Courville

工信出版社


background image




学习资源推荐(续)

• 吴恩达深度学习视频:

https://www.bilibili.com/video/av49445369?p=1

• 西瓜视频:搜索“浙江大学研究生机器学习课程”

深度学习发展史


background image




深度学习发展简史

• 从1940年起,首先提出了MP模型(McCulloch和Pitts提出的人工神经元

的简易数学模型)Hebb(海布)学习规则.这是神经网络的起源,也奠定了神
经网络的基础模型。

• 1960年,提出了感知机模型,感知机模型可以对简单的数据节点进行分类,

这个发现引起了第一波的AI浪潮,因为人们认为简单的感知机可以实现分
类功能,那通过组合可以实现更复杂的功能,但后面发现感知机无法模拟
异或运算,无法处理非线性的问题,第一波浪潮就这样沉入了低谷。


background image




深度学习发展简史(续1)

• 1980年Hopfiled网络,Boltzmann机和BP算法的提出,人们发现

可以增加网络的深度来实现非线性的功能,所以开始了第二次浪潮。
但是在80年代,计算机的计算能力十分有限,很难训练出一个有效
的模型来使用,所以导致了这种方式始终处于鸡肋的状态。再加上
同一时期浅层方法的成功,如SVM(1995), 使得人们转为研究浅
层的方法。

• 1998年CNN被提出,也应用到了邮政局的邮政编码识别,但是因

为当时并不重视这种深度网络,导致并没有火起来。


background image




深度学习发展简史(续2)

• 2006年,Hinton提出了DBN(深度信念网络),解决了更深层次

的网络是可以通过一些策略更好的训练和实现,所以就引起了现在
深度学习的第三次浪潮。


background image




深度学习发展简史(续3)

• 相比而言,区别于传统的浅层学习,深度学习强调模型结构的深度,隐含

层远远不止一层。通常来说,层数更多的网络,通常具有更强的抽象能力
(即数据表征能力),也就能够产生更好的分类识别的结果。

• 2012年,杰弗里·辛顿(Geoffery Hinton)教授团队在ImageNet中首次

使用深度学习完胜其他团队,那时网络层深度只有个位数。2014年,谷歌
团队把网络做了22层,问鼎当时的ImageNet冠军。到了2015年,微软研
究院团队设计的基于深度学习的图像识别算法ResNet,把网络层做到了
152层。很快,在2016年,商汤科技更是叹为观止地把网络层做到了1207
层。


background image




深度学习发展简史(续4)

• ImageNet Top5错误率和网络深度

– 2012年冠军(

AlexNet

, top-5错误率16.4%,使用额外数据可达到15.3%,8

层神经网络)

– 2014年亚军(VGGNet,top-5错

误率7.3%,19层神经网络),
2014年冠军(InceptionNet,
top-5错误率6.7%,22层神经网
络)

– 2015年的冠军(ResNet,top-5

错误率3.57%,152层神经网络)


background image




深度网络进化过程

感知机

(神经元)

多层感知机

(神经网络)

深度神经网络


background image




小结

• 时至今日,深度学习网络越来越深,应用越来越广,解决的问题越

来越难,扮演的角色越来越重要。但万丈高楼平地起,让我们追根
溯源,探索如何深度学习究竟是如何由一个简单的“单细胞”演化
成复杂神经网络系统的。