鲁鹏计算机视觉与深度学习

本笔记来自于鲁鹏老师的视频

https://www.bilibili.com/video/BV1V54y1B7K3？p=3&vd_source=4ddee6259222ad3b06bedffc7277f3fe

背景知识：

行业先驱： David Marr (1945-1980) 大卫马尔(David Marr) 是计算机视觉的先驱，被称为计算机视觉之父。马尔奖（Marr Prize）是由计算机视觉国际会议（ICCV, International conference on computer vision）的委员会颁发的计算机视觉领域的重要奖项，是计算机视觉研究方面最高的荣誉之一。注：ICCV是计算机视觉领域世界顶级的学术会议之一，每两年举办一届。其评选出的最佳论文（马尔奖）被看作是计算机视觉研究方面的最高荣誉之一。

一.图像分割

1.图像分割遇到的难点

语义鸿沟：人看到的和计算机看到的不一样除此之外还存在：视角不同，阴影，遮挡，尺度不同，形变，背景杂波，运动模糊的问题。

2.如何做？

2.1流程

2.2评价指标

2.3线性分类器的使用

2.3.1图像表示

2.3.2线性分类器的定义

线性分类器是一种线性映射，将输入的图像特征映射为类别分数。

2.3.3线性分类器的权值到底是什么？（多类支撑向量机）

2.3.4损失函数

损失函数搭建了模型性能与模型参数之间的桥梁，指导模型参数优化。

损失函数是一个函数，用于度量给定分类器的预测值与真实值的不一致程度，其输出通常是一个非负实值。
其输出的非负实值可以作为反馈信号来对分类器参数进行调整，以降低当前示例对应的损失值，提升分类器的分类效果

2.3.5损失函数的正则化（超参数）

2.3.6参数优化（梯度下降算法）

参数优化是机器学习的核心步骤之一，它利用损失函数的输出值作为反馈信号来调整分类器参数，以提升分类器对训练样本的预测性能

![在这里插入图片描述](https://img-blog.csdnimg.cn/8c90372479fd4e36ab9d3306cf45fa39.png ==)

2.3.7数据集的划分

2.3.8数据集的预处理

二.全连接神经网络

全连接神经网络级联多个变换来实现输入到输出的映射

1.1图像表示

1.2分类模型

1.2.1线性可分

1.2.2线性不可分

1.2.3两层（N层）全连接神经网络命名

1.2.4激活函数

激活函数有以下分类：

1.2.5网络结构的设计

用不用隐层，用一个还是用几个隐层？（深度设计）
每隐层设置多少个神经元比较合适？（宽度设计）没有统一的答案！

依据分类任务的难易程度来调整神经网络模型的复杂程度。分类任务越难，我们设计的神经网络结构就应该越深、越宽。但是，需要注意的是对训练集分类精度最高的全连接神经网络模型，在真实场景下识别性能未必是最好的（过拟合）。

1.3小结

全连接神经网络组成：一个输入层、一个输出层及多个隐层；
输入层与输出层的神经元个数由任务决定，而隐层数量以及每个隐层的神经元个数需要人为指定；
激活函数是全连接神经网络中的一个重要部分，缺少了激活函数，全连接神经网络将退化为线性分类器。

1.4 损失函数SOFTMAX

1.4.1指数化归一化

1.4.2交叉熵损失

交叉熵损失更能度量得分的好坏

1.5计算图与反向传播

计算图是一种有向图，它用来表达输入、输出以及中间变量之间的计算关系，图中的每个节点对应着一种数学运算。

1.任意复杂的函数，都可以用计算图的形式表示 2.在整个计算图中，每个门单元都会得到一些输入，然后，进行下面两个计算： a) 这个门的输出值 b) 其输出值关于输入值的局部梯度。 3.利用链式法则，门单元应该将回传的梯度乘以它对其的输入的局部梯度，从而得到整个网络的输出对该门单元的每个输入值的梯度

1.5.1颗粒度

这几个环节可以合并成一个函数，小颗粒编程大颗粒

1.6再谈激活函数梯度消失和爆炸问题

梯度消失是神经网络训练中非常致命的一个问题，其本质是由于链式法则的乘法特性导致的。