本笔记来自于鲁鹏老师的视频

https://www.bilibili.com/video/BV1V54y1B7K3?p=3&vd_source=4ddee6259222ad3b06bedffc7277f3fe

背景知识:

行业先驱: David Marr (1945-1980) 大卫马尔(David Marr) 是计算机视觉的先驱,被称为计算机视觉之父。 马尔奖(Marr Prize)是由计算机视觉国际会议(ICCV, International conference on computer vision)的委员会颁发的计算机视觉领域的重要奖 项,是计算机视觉研究方面最高的荣誉之一。 注:ICCV是计算机视觉领域世界顶级的学术会议之一,每两年举办一届。其评选出的最佳论文(马尔奖) 被看作是计算机视觉研究方面的最高荣誉之一。

一.图像分割

1.图像分割遇到的难点

语义鸿沟:人看到的和计算机看到的不一样 除此之外还存在:视角不同,阴影,遮挡,尺度不同,形变,背景杂波,运动模糊的问题。

2.如何做?

2.1流程

2.2评价指标

2.3线性分类器的使用

2.3.1图像表示

2.3.2线性分类器的定义

线性分类器是一种线性映射,将输入的图像特征映射为类别分数。

2.3.3线性分类器的权值到底是什么?(多类支撑向量机)

2.3.4损失函数

损失函数搭建了模型性能与模型参数之间的桥梁,指导 模型参数优化。

  • 损失函数是一个函数,用于度量给定分类器的预测值与真实值的不一致程度,其输出通常是一个非负实值。
  • 其输出的非负实值可以作为反馈信号来对分类器参数进行调整,以降低当前示例对应的损失值,提升分类器的分类效果

2.3.5损失函数的正则化(超参数)

2.3.6参数优化(梯度下降算法)

参数优化是机器学习的核心步骤之一,它利用损失函数的输出值作为反馈信号来调整分类器参数,以提升分类器对训练样本的预测性能

![在这里插入图片描述](https://img-blog.csdnimg.cn/8c90372479fd4e36ab9d3306cf45fa39.png ==)

2.3.7数据集的划分

2.3.8数据集的预处理

二.全连接神经网络

全连接神经网络级联多个变换来实现输入到输出的映射

1.1图像表示

1.2分类模型

1.2.1线性可分

1.2.2线性不可分

1.2.3两层(N层)全连接神经网络命名

1.2.4激活函数

激活函数有以下分类:

1.2.5网络结构的设计

  1. 用不用隐层,用一个还是用几个隐层?(深度设计)
  2. 每隐层设置多少个神经元比较合适?(宽度设计) 没有统一的答案!

依据分类任务的难易程度来调整神经网络模型的复杂程度。分类任务越难,我们设计的神经网络结构就应该越深、越宽。但是,需要注意的是对训练集分类精度最高的全连接神经网络模型,在真实场景下识别性能未必是最好的(过拟合)。

1.3小结

  1. 全连接神经网络组成:一个输入层、一个输出层及多个隐层;
  2. 输入层与输出层的神经元个数由任务决定,而隐层数量以及每个隐层的神经元个数需要人为指定;
  3. 激活函数是全连接神经网络中的一个重要部分,缺少了激活函数,全连接神经网络将退化为线性分类器。

1.4 损失函数SOFTMAX

1.4.1指数化 归一化

1.4.2交叉熵损失

交叉熵损失更能度量得分的好坏

1.5计算图与反向传播

计算图是一种有向图,它用来表达输入、输出以及中间变量之间的计算关系,图中的每个节点对应着一种数学运算。

1.任意复杂的函数,都可以用计算图的形式表示 2.在整个计算图中,每个门单元都会得到一些输入,然后,进行下面两个计算: a) 这个门的输出值 b) 其输出值关于输入值的局部梯度。 3.利用链式法则,门单元应该将回传的梯度乘以它对其的输入的局部梯度,从而得到整个网络的输出对该门单元的每个输入值的梯度

1.5.1颗粒度

这几个环节可以合并成一个函数,小颗粒编程大颗粒

1.6再谈激活函数 梯度消失和爆炸问题

梯度消失是神经网络训练中非常致命的一个问题,其本质是由于链式法则 的乘法特性导致的。