目录

引入

一、模式识别主要方法

1、统计模式识别

2、基于隐马尔可夫模型识别

3、模糊模式识别

4、人工神经网络模式识别

总结

二、模式识别应用

1、车牌定位

2、车牌识别

参考文献:


引入

人在观察事物或现象时,常寻找它与其他事物或现象不同之处,并根据一定目的把相似、但又细节不同的事物或现象组成一类——如字符识别,虽然每个人写的数字“8”都不一样,但都是同一类。

模式识别是AI的一个重要方向,目的在于模拟人的感知能力,也称“机器感知”、“智能感知”。其发展于20世纪40年代电子计算机的出现,21世纪与深度学习融合,近年深度学习和大数据极大推动了其发展!包括声音和语言识别、文字识别、指纹识别、声纳和地震信号分析、图片分析、化学模式识别等等。


一、模式识别主要方法

对数据关系的挖掘抽象为一个分类问题,就是模式识别问题。模式识别是一种从大量信息和数据出发,在专家经验和已有认知的基础上,利用计算机和数学推理方法对形状、模式、曲线、数字、字符格式、图形自动等自动完成识别的过程

1、统计模式识别

这是一种比较常用且较为完备的识别方法,主要步骤如下:

1. 数据预处理:收集和准备用于训练和测试的数据集,剔除噪声和冗余。2. 特征提取:从原始数据中提取有代表性的特征向量,映射到特征空间。3. 特征选择:根据算法需求或者降低维度的目标,选择最重要的特征。4. 模型训练:使用统计方法(如贝叶斯分类器、支持向量机等)对提取的特征进行训练。5. 模型评估:通过测试数据集评估模型的准确性和性能。6. 模型优化:根据评估结果对模型进行调优,例如调整参数或改善特征提取过程。

难点和关键点在于如何使用适合的分类器算法,现在常用的都是在符合正态分布情况下,忽略偏离较远的数值进行估计的方法。

2、基于隐马尔可夫模型识别

隐马尔可夫模型(HMM)是一个统计模型,用来描述一个含有隐含未知参数的马尔可夫过程。通常由两部分组成:①无法肉眼观察的具有一定状态的隐式马尔可夫链;②用统计分析方法直接描述的离散的一般随机过程——一般为正态分布和泊松分布下的概率密度函数分布。通过一定量的统计学习来确定一个大概的状态值之后,生成一个近似的隐马尔可夫模型,只需要通过提取特征代入就可以得到相关数据来判别和分类。

1. 定义状态集合:确定系统的状态集合,每个状态表示一个观测值的类别。2. 定义观测集合:确定系统可能产生的观测值集合。3. 确定初始概率分布:指定模型在开始时处于每个状态的概率。4. 确定转移概率矩阵:指定模型在不同状态之间转移的概率。5. 确定观测概率矩阵:指定模型在每个状态下观测到每个观测值的概率。6. 解码算法:使用算法(如维特比算法)根据观测序列推断隐藏状态序列。

3、模糊模式识别

模糊模式识别源于模糊数学,在此基础建立了模糊集理论。模糊集是一个具有模糊性的概念集合,抽取的数据模糊化后建立合适的隶属度函数和模糊规则集,最后解出结果。

1. 模糊化:将输入的模糊数据转化为隶属度函数,描述其在各个类别上的归属程度。2. 规则定义:根据领域知识或经验,定义一组模糊规则,用于将模糊数据映射到具体的类别。3. 推理机制:基于模糊规则,使用推理机制对输入进行推理,以确定输出的类别。4. 去模糊化:将推理结果从模糊集合转化为具体的类别或数值。

此方法极大增加了判别成功率,不会因为某些特别参数而导致数据不可识别。缺点是模糊集范围由人的主观经验确定,不同人的概念模型不同,需要结合其他识别方法,此理论当前还不够充分。

4、人工神经网络模式识别

最流行的模式识别方法,其在准确性和适用性方面有突出表现。BP神经网络是一种按照误差逆向传播算法训练的多层前馈神经网络,是应用最广泛的神经网络模型之一。属于有监督学习。

1. 确定网络结构:选择适当的神经网络类型(如前馈神经网络、卷积神经网络等)和层数,并确定每层的节点数和连接方式。2. 数据预处理:收集和准备用于训练和测试的数据集,并进行标准化处理。3. 初始化网络:初始化网络的权重和偏置参数。4. 前向传播:将输入数据通过网络,逐层计算每个节点的输出值。5. 反向传播:根据网络的输出结果和目标值,计算每个节点的误差,并通过梯度下降法更新网络参数。6. 训练模型:重复进行前向传播和反向传播,调整网络参数,直到达到预定的停止条件。7. 模型评估:使用测试数据集评估训练好的模型的性能和准确性。

在BP神经网络中加入适量的隐层,正确的信息会沿着“神经元”向前传播,有误的信息则会退回上一个 “神经元”,并且修正传播节点之间的权重,判别函数 动态更新,使其识别准确度很高。缺点建立合适神经网络需要大量数据,资源消耗大。

总结

①统计模式识别是基于统计学理论和模型的一种方法,主要关注特征提取和模型训练。它适用于各种数据类型,但需要具备较好的特征工程能力。
②基于隐马尔可夫模型识别方法则着重在描述序列数据背后的状态变化,适用于时序数据的建模与识别。它可以考虑到时间上的依赖关系,但对初始状态和转移概率的假设限制较大。
③模糊模式识别通过模糊化和去模糊化的过程,能够处理模糊性较强的输入数据。它可以应对不确定性和模糊性,但规则的定义需要领域知识的支持。
④人工神经网络模式识别利用神经网络的强大拟合能力,可以自动学习特征表示和复杂的非线性关系。它适用于各种任务,但需要大量的数据和计算资源进行训练。


统计模式识别基于隐马尔可夫模型识别方法更加注重建模和概率推断适合处理结构化数据和时序数据模糊模式识别关注处理模糊和不确定性的问题,并需要领域知识进行规则定义。人工神经网络模式识别能够灵活地适应不同任务和数据类型,通过大量的训练数据可以达到较好的性能,但需要较高的计算资源和时间成本。


二、模式识别应用

医学分析、人脸指纹识别、语音识别、交通网络等都有它的身影!以下是语音识别的流程图:

车牌的定位和识别为例,大致流程如下:

定位:①首先将带车牌图像转换到 HSI 颜色空间;②运用传统图像处理方法粗定位车牌位置;③通过重心法进行倾斜校正最终确定车牌区域

识别:①然后对中文和非中文字符采用不同的算法进行字符切割;②用模式识别的理论对车牌区域特征提取与选择;③分类判决进行车牌字符识别,输出车牌号。

1、车牌定位

目前的车牌定位主要有数学形态学、颜色分割、基于图像的纹理和形状特征等多特征的定位算法。

①粗定位:分割出车牌在图像中所处的区域,包括图像的二值化、图像去噪,连通集的分析定位车牌区域。

首先需要将图像由RGB转换到HSI空间,设定相应阈值得到初步定位;然后将图像二值化,并用点扫描法去除噪点与细纹——逐行扫描像素点,将不符合设定阈值的白点去掉。

此时可得到一块平行四边形的联通集,将这区域剪切出来得到粗定位的车牌图像。

②倾斜校正:图像可能不水平,这会影响车牌字符的分割和识别。

首先对粗定位的二值图片和粗定位的车牌图片分别分析,求出倾斜度K(基于重心的思想求得)

a、将一个二值图像中每一个白点像素看做一个质量为1的质点,利用重心公式可求得图像的重心。

b、得到二值图像的总体重心后,以该重心像素为界将图像分成左右两个部分,分别用相同的办法得到左右两部分的重心

c、用一个向量连接两个重心,然后计算出这个向量相对水平方向的倾斜角,即倾斜角度K。据此对彩色图像惊醒校正。

2、车牌识别

字符识别主要有模板匹配、伽柏变换、SVM、基于深度学习的识别算法

①字符分割:将车牌区域的字符逐个分割出来,以便输送到字符识别模块进行识别。

a、预处理算法:由于光照等影响,蓝色车牌在名都、纯度、饱和度等有比较明显差异,深浅不一,所以在灰度化之前,要对其进行直方图规定化,使得所有车牌的蓝色背景和白色字符分布在同一灰度级。

规定化之后,根据先验经验以及实验测试设立一个合理的阈值,将小于阈值的像素点设置为黑色,待遇阈值设为白色,实现灰度化

b、主算法:英语字母和阿拉伯数字是单连通集字符集,可采用连通集的方法分割;汉字是由多个连通集组成,不能采用该方法,可采用一种由大量实验得到的设置矩形长宽进行截取的方法。

1、对于字母和数字,只要得到每一个字符连通域起点像素和终止像素 , 就得到了包含整个单连通域的最小矩形区域。依此方法逐个切割矩形区域图像,实现非中文字符的切割。具体算法是逐列逐行扫描像素,当扫描到连续 m(3) 列有像素灰度级为 1 时,将扫描到的第一个像素所在的列当作字符连通域的第一列,继续逐列扫描,当发现连续 n(3) 列所有像素灰度级为 0 时,将首先出现全为 0 灰度级的列当作字符连通域的结束列。这样我们就能够将车牌的第 2 到 7 个的字符逐步切割输出该部分图像,完成非汉字字符分割。2、对于汉字字符的切割,几乎所有省份的简称都包含有多个连通集,所以连通集取矩形轮廓的方法将不再适用。采用将第二个字符框平缩放移的方法:在大量实验结果发现,在取已经分割出来的第二个字符(即第一个非汉字字符)图像的矩形扩大 1.2 倍,再将此矩形往左平移 1/7 整个车牌矩形的宽度,此时矩形所在的车牌的区域就是中文字符所在区域,我们将此区域图像截取输出,完成车牌中文字符的切割。

②字符识别

模式识别的大致过程:从测量空间到特征空间,再映射到模式空间

对于字符识别:先获取待识别字符的图像特征,依据相应的准则来确定字符图像的模式类别——特征获取、特征选择、分类判决。

a、收集已知字符类别的字符图像,统计其特征,包括其在二维空间中的位置特征、直方图特征、形状特征以及经过傅里叶变换转换到频域的特征。将这些特征提取和学习,得到模板存储起来。

b、用相同方法获得待识别字符图像的各方面特征,和存储的模板匹配对比,依据对比结果判决字符类别。

注:根据向量间的距离(欧氏距离)衡量字符和模板的匹配程度。建立模板库的具体过程是将每一类图像的每一张图片平均分成8份,逐点扫描每一份图片区域,以一维向量的形式记录并保存下这份图像的像素信息,从而每一张字符图像都有相应的8维向量形成的模板。将待识别的车牌字符图片采取相同的方法,然后确定每个字符图片的8维向量值。我们求出这个字符的8维向量值和所有模板字符图片的8 维向量值的n维欧式空间距离,将其中距离最小的N个(5 个)模板字符图片保存下来。

参考文献:

[1]林翰冉.模式识别技术及其在图像处理中的应用[J].现代工业经济和信息化,2023,13(02):161-163.DOI:10.16525/j.cnki.14-1362/n.2023.02.059.

[2]李潇彤.基于模式识别的智能车牌识别系统[J].中国战略新兴产业,2018(04):155-156.DOI:10.19474/j.cnki.10-1156/f.003243.