学术论文网
车牌识别系统的设计与实现
发布日期:2021-03-15 16:53:59

第一章 绪论

1.1 研究背景和意义

随着我国高速公路的迅猛发展和汽车数量的不断增加,道路交通与车辆管理问题日益严重,突出呈现违章车辆增多,车辆通行费的大量流失,交通环境污染不断加重等一系列问题。智能交通系统(Intelligent Transportation System,简称 ITS)是近年来国际上飞速发展的新兴产业,其应用领域贯穿整个交通运输的全过程。其目的就是利用高性能、高效率的计算机、自动化等科学技术提高交通利用率、缓和道路堵塞、减少交通事故等。目前,世界上经济发达国家的一些城市及高速公路系统已经有商用智能交通系统产品来辅助管理交通运输。

ITS 在国内的发展相对起步较晚,直到 90 年代后才逐渐被提起。虽然起步较晚,但因为国际上关于 ITS 的研究已经较为深入,有不少的成功经验对国内的发展有着重要的参考价值和指导意义。目前,在我国的一些一线大城市已经装备了ITS 的产品。可以说,ITS 在我国已经进入了一个快速发展期。汽车牌照的自动识别(License Plate Recognition LPR)是 ITS 的一个重要组成部分和关键技术之一。

一般可分这样几个子系统:车牌图像采集系统,负责采集获取实际情况下的各种车牌图像1。车牌识别软件子系统,其主要任务是对采集获取的车牌图像中的车牌进行定位、分割、字符切分、字符识别等工作,是车牌识别系统的关键部分。结果处理子系统,对完成识别的车牌进行处理。如各种检测、追中、查找等。它综合了计算机视觉、人工智能、光学、模式识别、自动控制等多种科学技术,有着极为广泛的应用价值。

1.2 研究现状

对于车牌识别系统的研究已经日趋成熟,也有不少较成熟的产品已经应用于实际交通管理。但是这样的系统多是在汽车静止状态下进行工作的,如高速公路的收费站、停车场入口和出口等。对高速运动中的汽车牌照进行准确的自动识别,是目前进一步提高车牌识别系统(LPR)在实际情况中应用价值的方向,也是目前车牌识别系统仍然还在进行研究和完善的关键原因之一。

20世纪90年代初,国外的研究人员就开始了对汽车牌照识别的研究。以色列Hi-Tech公司的 see/carsystem系列,新加坡OPtasia公司的LPRS系列都是比较成熟的产品。其中vLPRs产品主要适合新加坡的车牌,Hi-Tech公司的 see/Carsystem有多种变形的产品来分别适应某一个国家的车牌。 see/CarChinese系统可以对中国大陆的车牌进行识别,但都存在很大的缺陷,而且不能识别车牌中的汉字,另外日本、加拿大、德国、意大利、英国等各个西方发达国家都有适合本国车牌的识别系统2

国内在90年代也开始了车牌识别的研究。目前比较成熟的产品有中科院自动化研究所汉王公司的“汉王眼”,亚洲视觉科技有限公司、深圳吉通电子有限公司等也有自己的产品,另外,西安交通大学、上海交通大学、清华大学、浙江大学等也做过类似的研究3

1.3论文的结构

本文以数字图像处理和模式识别的现状为基础,对车牌图像预处理、车牌定位、字符分割以及字符识别等技术进行了研究。

第一章是绪论,主要介绍了车牌识别系统的研究背景、研究现状,及本论文的主要工作。

第二章主要研究车牌图像预处理算法。本章介绍的预处理算法包括对彩色图像车牌定位算法、灰度化处理、二值化、图像增强等预处理算法,最后得到符合分割要求的车牌区图像。

第三章主要分析了车牌字符的特点,在字符具有尺寸、排列特点等先验条件下采用垂直投影法实现字符的分割。

第四章主要研究研究字符识别算法。本章首先介绍了几种字符识别方法,经过对比,选择了模版识别算法并对其工作原理进行了详细的研究。

第五章为实验结果,并对系统的性能进行验证,并对实验结果及误差进行了简单分析。

最后一章总结了本文的工作,并对下一步研究工作做出了展望。

 

第二章 彩色车牌的定位及预处理算法

2.1 常见车牌定位方法

根据车牌的不同特征,人们提出了各种定位的方法。目前,主要通过两条技术路线进行车牌定位的研究4】【5:一类是基于灰度图像处理技术,另一类是基于彩色图像处理技术。

2.1.1 灰度特征法

Barroso 用穿过车牌区域的水平直线,其灰度呈连续峰、谷、峰分布这一特征来实现车牌定位。该方法通过统计穿过图像水平线的灰度分布图中波峰、波谷的个数来确定车牌的大致区域;LSalgadoYuntao cui 等都提出根据牌照区域中灰度或颜色的变化频率高低来确定牌照区域;王少杰也利用字符区域的水平和垂直投影呈连续的峰、谷、峰这一特征来提取货运列车中的字符区域。

2.1.2 基于边缘检测的提取方法

图像的边缘是指在灰度级上发生急剧变化的区域,而在背景或者物体的内部这种灰度的变化是比较平缓的。边缘检测的任务是精确提取边缘和抑制噪声。能够进行检测的方法有多种,如Roberts边缘算子、Prewitt算子、Sobel算子以及拉普拉斯边缘检测。这些方法正是利用了物体边缘处灰度变化剧烈这一特点来检测图像的边缘。各算子对不同边缘类型的敏感程度不同,产生的效果也不同,经过大量实验分析可知,Roberts边缘算子是一种利用局部方差算子寻找边缘的算子,提取比较精确,Prewitt算子和Sobel算子对噪声有一定的抑制能力,但不能完全排除伪边缘,拉普拉斯算子是二阶微分算子,对图像中的阶跃型边缘点提取准确且具有旋转不变性,但容易丢失一部分边缘的方向信息[lsl,同时抗噪能力较差。所以针对不同的环境和要求,选择合适的算子来对图像进行边缘检测才能达到好的效果。

2.1.3基于纹理特征分析的方法

传统的纹理特征分析提取算法大多基于灰度图像来分析的,所以在车牌提取以前,需要对图像进行预处理,将彩色图像转换为灰度图像。纹理分析算法描述如下:首先进行行扫描,找出图像中每一行所含有的车牌线段,记录下它们的起始坐标和长度。如果有连续若干行均存在不少于一个的车牌线段,且行数大于某一确定的闽值,则认为在行的方向上找到了车牌一个候选区域,并确定了该候选区域的起始行和高度。在已找到的可能存在车牌的区域做列扫描,以确定该车牌候选区域的起始行和高度以及起始列坐标和长度。由此确定一个车牌区域。继续在其他可能存在车牌的区域寻找,直至找到所有的车牌候选区域。

2.1.4 基于彩色图像的车牌定位方法

彩色车牌图像包含的信息明显多于灰度图像,随着计算机处理速度的提高,利用颜色信息可以更有效地实现车牌定位。同时车牌颜色也是车辆分类的一个重要参数,相同的车牌号码可能存在不同车牌颜色的情况,也就是根据车牌号码和车牌颜色才能唯一标识车辆。

根据车牌底色等有关的先验知识,采用彩色像素点统计的方法分割出合理的车牌区域。CCD 拍摄的彩色图片的像素点通常是采用 24 RGB 表示。但R G B 3 个分量之间有很高的相关性,直接利用这些分量常常不能得到所需的分割效果。比较接近人对颜色视觉感知的是色度,饱和度和亮度(HSI )空间。其中I 表示颜色的明暗程度,H 表示不同的颜色,S 表示颜色的深浅,I 分量与颜色信息无关,H S 分量与人感受彩色的方式紧密相连。所以需要把图像从RGB 空间转换到HSI 空间,它们之间的转换关系如下:

                           2.1

      2.2

李文举提出:中国的车牌的字符和背景具有固定的颜色搭配(共包含四种:蓝底白字、黄底黑字、白底黑字或红字以及黑底白字),也就是说车牌字符边缘两侧像素的颜色具有固定的搭配。基于它,对车牌进行定位,可以去掉不符合车牌底色的非车牌区域,而且能够将车牌底色退色或虽具有和车牌相似的几何及纹理特征但不符合颜色特征的伪车牌剔除。Xifan Shi 等基于RGB HLS 两种模型把车牌颜色分为13种,也实现了车牌的定位。高朝晖等使用特征函数进行颜色分类处理,以蓝底白字车牌为例,把颜色分为蓝色、白色和其他三种;然后通过扫描线粗搜索车牌区域(步长较大);再通过设定阈值(扫描线间隔)精搜索车牌位置;最后采用信息融合技术,结合车牌区域的长宽比,字符区域的长宽比和背景色比例(车牌背景颜色占车牌区域比例)等特征,去除干扰区域,正确检测并定位出车牌区域。

本文的车牌定位就是采用基于颜色的定位方法,适用用蓝底白色的车牌,经过反复的试验确定R分量的像素值在小于60G分量的像素值在4172之间,B分量的像素值在119142之间,则认为该区域为车牌所在的区域,然后统计该区域的蓝色像素点的个数,在车牌的XY方向均做此处理。图2.1和图2.2分别为原始的车牌图像和定位后的车牌图片,

 

2.1 原始的汽车图片

 

2.2 定位后的车牌图片

2.2 彩色图像的灰度化

我们采集的车牌原始图像是彩色图像,由于这种图像包含大量的颜色信息,每个像素都具有 3 个不同的颜色分量 RRed)、GGreen)BBlue),这样的图像占据的存储空间很大,而灰度图像是指 RGB 分量都相同的一种特殊的彩色图像,一般1个像素点的变化范围为 256 种,即只含有亮度信息,形成了以亮度为层次的灰度图像。灰度值大的像素比较亮,反之较暗,灰度图象相对于彩色图像可以大大节省存储空间。颜色的三个分量分别用 RGB 表示,像素点的灰度值为 Grey,图像灰度化可采用下面方法实现6

         2.3

在转换的过程中,利用式(2.3)图像往往会出现一定的损失,所以又称有损转换(见图 2.2 2.3 的效果对比)。

 

2.3 灰度化的车牌图像

2.3 车牌图像二值化

在车牌识别技术的研究中,图像的二值化处理7是关键的一步,二值化的效果直接影响到后面的车牌定位以及字符切分和识别。因为字符的切分和识别都是基于车牌区域的二值化结果进行的。二值化算法又称为闭值算法,其目的就是找出一个合适的阈值,将待研究的车牌区域划分为前景和背景两部分。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。当图像具有二值倾向时,即图像中基本上只有背景和目标图像两种颜色时,可以确定一个闭值点 C 为两颜色的分界点,对图像进行二值化处理。图像二值化可以消除模糊,减少复杂度,使处理的图像更加突出。所以下面介绍两种基于灰度的二值化算法。

2.3.1 全局动态二值化方法

全局动态二值化从整个灰度图像的像素分布出发寻求一个最佳的门限,其中的经典算法是Otsu 算法,它是在判别最小二乘法的基础上推导而来的。其基本原理是:对一幅图像,记T为目标与背景的分割闲值;目标点数占图像像素点数的比例为,平均灰度为;背景点数占图像像素点数的比例为,平均灰度为。图像的总平均灰度为,则两类间方差的计算公式为:

          2.4

2.3.2  极小值点阈值

将图像的灰度直方图的包络看作一条曲线,则选取直方图的谷可借助求曲线极小值的方法。设 h(z)代表直方图,那么极小值点应同时满足:

    2.5

和这些极小值点对应的灰度值就可作为分割阈值。实际图像的直方图由于图像噪声等原因经常有很多起伏,按上式求得的极小值点有可能对应虚假的谷,解决方法之一是先对直方图进行平滑处理。

2.3.3迭代阈值分割

通过迭代计算同样可以得到阈值。首先选取图像的灰度范围的中值作为初始值,然后按下式迭代:

          2.6

上式中 是灰度为k值的像素个数,共有L个灰度级。迭代一直进行到结束,取结束时的为阈值。该方法所确定的阈值作用于整幅图像中的每个像素,因而对目标或背景的灰度有剧烈变化的图像,阈值分割效果比较差,甚至失效。

经实验验证,全局动态二值化法较后面两种方法的二值化效果更好。局部阐值法为每个像素设置不同阐值,像素点闭值的选择一般只与其周围像素灰度值有关。对于车牌字符图像的二值化,研究者做了许多工作,提出了很多效果很好的算法。在本系统中,采用的是基于全局动态二值化的阈值选取方法,因为其在二值化效果中表现良好,同时迭代法的执行效率高,图2.4就是灰度车牌二值化后的结果图。

 

2.4 二值化车牌图像

2.4 车牌图像增强处理8

虽然字符在经过二值化处理后,在特征对比度方面有着一定程度的提高,但是二值化后的车牌字符图像,仍然存在着较大的噪声,这些噪声有可能是孤立的噪声点,也可能是区域面积较大的块状噪声,如上图2.4所示。这些噪声都会干扰影响图像的辨认,根本无法进行定位与分割,因此人们采用图像平滑方法来消除噪声,如:邻域平均法和低通滤波法。图像增强处理不论是对牌照图像的可辨认度的改善,还是简化后续牌照字符定位和分割的难度都很有必要。抑制或消除这类噪声而改善图像质量的过程称为图像的平滑过程。下面介绍一些常用的平滑算法:

2.4.1邻域平均法

在邻域平均法中,我们假定图像是由许多灰度恒定的小块组成,相邻像素间有很高的空间相关性。而噪声是统计独立地叠加在图像上的,其均值为0,因此,可以以用邻域内各像素灰度值的平均值代表原来的灰度值,实现图像的平滑。根据求平均值方式的不同,邻域平均法有如下几种主要形式:简单平均法,闭值平均法,K近邻平均法。

2.4.2低通滤波法

我们知道,从频谱上看,噪声特别是随机噪声是一种具有较高频率分量的信号。平滑的目的就是通过一定的手段滤去这类信号。一个很自然的想法就是使图像经过一个二维的低通数字滤波器,让高频信号得到较大的衰减。在空间域上进行的这种滤波实际上就是对图像和滤波器的冲击响应函数进行卷积。

2.4.3中值滤波

中值滤波是一种非线性的信号处理方法,与其对应的中值滤波方法是一种非线性的图像平滑方法。中值滤波在一定的条件下可以克服线性滤波器如最小均方滤波、均值滤波等带来的图像细节模糊,而且对滤除脉冲干扰及图像扫描噪声最为有效。在实际运算过程中,由于不需要计算图像的统计特征,因此速度快,实现方便,特别适合处理的车辆图片背景噪声中的一些孤立噪声。图2.5就是本文采用中值滤波方法图像平滑后的效果图。

 

          2.5 车牌平滑后的图像

 

第三章 车牌字符分割研究

从定位后的车牌区域正确的将单个字符分割出来是下一步字符识别成功与否的关键,由于目前大多数字符识别算法都是针对单独字符进行识别的,因此在准确定位车牌后,字符切分的好坏对字符识别也起着重要的作用。对于字符切分方法,国内外研究人员提出了不少算法。对于车牌的字符切分,总体说来就是充分利用车牌的先验知识,将单个字符分别从车牌区域图像中切割出来。字符切分的基本方法是利用字符与字符之间的空白间隔在图像垂直投影上形成的空白间隔将单个字符图像分隔开来,分别存储在数组中待其后的字符识别。

3.1 字符分割算法研究9】【10

3.1.1连通区域分割法

1)搜寻连通区域

按行扫描整个车牌图像,遇到前景图像时,以此点为中心进行上、下、左、右、左上、左下、右上、右下八个方向的跟踪,将跟踪结果保存,继续扫描。按照这种方法将整个车牌搜索完后就可以得到前景区域,根据车牌字符的长宽比例,可以删除一些不满足条件的区域。这样得到了符合字符条件的位置。

2)统计所有连通区域,进一步确定字符宽度和高度。单纯依靠上述的长宽比等特征难以去除为字符,接下来要做的是统计所有连通域的高度以及宽度,求出宽度和高度的密度分布,这样就可以去除面积较大的伪字符,但是它们的长宽比和车牌很相同。

3.1.2模板匹配法

首先对二值化车牌进行垂直投影,然后再对投影曲线进行平滑,搜索已平滑曲线的波谷值得到波谷位置序列。然后,根据车牌的纹理特征,将相邻的波谷作为一个字符的左右边界提取出一个矩形区域。然后再考虑某些字符的特征,对矩形区域进行后处理,比如删除、合并,调整大小等操作。

该方法较好地解决了有些汉字不连通的问题,具有一定的抗干扰性,解决了背景干扰,车牌尺寸不同及车牌上某些字符磨损的等现象。但是由于算法复杂,大量使用循环,影响实时性,对一些特殊车牌如上下两排字符,本算法不适用。关于其他的车牌字符分算法,比如边缘跟踪法和漫水法相结合的方法,基于聚类分析的方法等算法复杂,运行占用时间长,实时性不高。

3.1.3本文字符分割算法

本文采用简单快速的垂直投影法。投影法进行图像字符分割是最为简便快捷的方法,其思想是根据车牌字符的特点,将车牌图像进行垂直方向的投影。因为字符区域包含大量白色像素点比较多且集中,且每个车牌字符之间有一定的空隙间隔隔开。这样投影下来得到的投影图上会有若干个相对集中的投影峰值群。只需要根据峰值群的特点进行分割,就可得到车牌的字符的区域划分。

根据车牌图像的垂直投影累加值,从右往左定位出每个字符的起始和结束位置,并且切割出来。对切割出来的每个字符图像进行水平投影。然后再根据水平投影像素累加值进行水平切割,这样就得到了字符的精确位置。字符定位分割后的图像如图3.1所示。具体算法如下:

1)对车牌图像进行垂直投影,定位出每个字符的左右边界,并保存在数组里;

2)把每个字符切分出来,再进行水平投影,定位出字符具体的上下边界,并保存在数组里;

3)根据每个字符的边界,把字符信息保存在数组里。并在图像中显示定位情况。

 

          3.1切割后的车牌字符

3.2 字符归一化

经因为车牌实际获取的图像往往大小不一致,这对字符特征提取来说,是很大的困难,为使字符成为统一大小、同一尺寸的图像,经常对大小不同的字符图像进行一些变换,这个过程叫做字符大小的归一化。

常用字符归一化方法有两种,一种是将文字的外边框,按比例线性缩小或放大变成统一的、规定尺寸的文字图像;另一种是根据垂直和水平两个方向的文字的黑像素分布情况,进行归一化。这里我们采用双线性差值算法将文字的外边框按比例线性放大或缩小成为规定尺寸的字符。为了后续特征提取处理方便,将归一化成将字符大小统一为40pixel×20pixel,图3.2就是归一化的车牌字符。

 

3.2 归一化后的车牌字符

 

第四章. 车牌字符识别

车牌字符进行准确切分后,本章完成车牌识别最后一步——车牌字符识别,这一步也是计算量比较大的一部分。车牌字符识别常用方法有基于模板匹配、特征匹配和神经网络的方法等,本章简单的进行介绍。

4.1字符识别的常用方法11】【12

(1) 基于模板匹配的字符识别算法

首先对待识别字符进行二值化,并将其尺寸大小缩放为字符数据库中模板的大小,然后与所有的模板进行匹配,最后选择最佳匹配作为结果。该方法识别速度快,但是对噪点比较敏感。在实际应用中,为了提高正确率往往需要使用大的模板或多个模板进行匹配,处理时间则随着模板的增大以及模板个数的增加而增加。

(2) 基于特征分析匹配的字符识别算法

这类方法是基于特征平面来进行匹配的,是使用率较高的一类方法,相比较于模板匹配而言,它能更好地获得字符的特征,有的特征对噪声不敏感。根据所提取特征的类型,特征分析匹配的方法又可分为:整体变换分析法、特征抽取法以及几何和拓扑的方法。对于整体变换分析法,这些特征的提取相对容易的,但是通常都需要较大的计算量。找到一个合适的变换来较多地反映字符的主要特征又是很关键的;对于由点的统计分布得到的特征抽取法,这些特征包括字符的轨迹、交叉点等,可以接受字体的变化,速度较高,复杂性也较小,但是通常这类特征的掩模的生成比较困难;对于几何和拓扑的方法,利用字符的结构把字符分解为构成它的元素,主要是获取字符的关键形状特征,这类特征允许存在一定的字体变形,并可以较高速的处理字符,但是通常特征提取的过程是复杂的,并且这些特征的模板也不容易生成。

(3) 基于神经网络的字符识别算法

主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。其中,字符特征的提取是研究的关键,特征参数过多会增加训练时间,过少会引起判断上的歧义。另一种方法是充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。这种网络互连较多,待处理信息量大,抗干扰性能好,识别率高。但是产生的网络结构比较复杂,输入模式维数的增加可能导致网络规模庞大。

因为本系统是针对10个数字及24个英文字母,模板相对较少的特点,采用了模板匹配法。模板匹配法是实现离散输入模式分类的有效途径之一。

4.2模板匹配字符识别

4.2.1 模板匹配字符识别

首先以二维图像的处理为例介绍一下传统的模板匹配算法。算法的基本思想是:将归一化的字符二值图像与模板库中的字符二值化图像逐个进行匹配,比较它们之间的相似度,可以计算它们之间的距离,距离越小,相似度越高。系统采用欧式距离计算二者的相似度:

               4.1

其中, d为待识别车牌字符和模版字符之间的欧式距离,为待识别车牌字符图像中像素点(i , j )的值,为模板字符图像中像素点(i , j )的值;M N为模板字符的尺寸。

匹配的步骤为:

1)依次取出模板字符,将每个模板字符和待识别车牌字符按公式(4.1)计算他们的欧式距离。

2)依次从待识别的字符与模板字符的欧式距离中找出最小欧式距离所对应的模板字符,该模板字符就是该待识别的字符检测结果。

4.2.2 创建匹配模板

创建匹配模板是用来匹配分割出来的字符,其尺寸大小应该是一定的。根据我国车牌的特殊要求,将字符模板分为汉字、英文字母和数字模板,图像的尺寸太大,模板匹配所需时间就长;但是,如果图像太小,其包含的有用信息就会减少,表达的内容就不够完整,所以模板必须适中。在本系统中,牌照的字符宽度一般不会超过 20 个像素,为了保证模板图像信息的完整性,同时综合实际牌照中的字符长宽比例关系,以及系统处理速度等,规定二值化后的模板的大小为40 × 20像素。

本系统中将所有的车牌按照前述的算法进行定位,灰度化、二值化、平滑滤波及切割后,形成了系统所需要的字符模版。

4.2.3模板匹配

模板匹配是该算法的最后一步。一般的模板匹配法是用已知的模板和原图像中同样大小的一块区域去对比。然后平移到下一个像素,仍然进行同样的操作直到将所有的位置都对比完。

基于模板匹配的字符识别算法对字符识别之前的车牌的处理算法要求较高,字符清晰度的变化对识别的准确率有较大影响。在实际中为了提高正确率往往需要使用大量的模板进行匹配,处理时间也会相应的增加。

 

第五章 系统测试及分析

本文随机的抓拍了一些车辆图片,经过筛选,选取了16张具有代表性的车牌进行识别实验,实验环境是在matlab2009A上进行的。实验的流程如下所示:

 

5.1 车牌识别测试系统流程

具体实验步骤如下:

(l)执行TEST.M 文件,跳出一个打开文件对话框,选择要测试的汽车图片,在经过了车牌定位以后,找到车牌的位置,提取出待进行识别的车牌。

 

         5.1 原始车牌图片和定位后的车牌图片

(2)接着进行灰度化、二值化和图像平滑,得到处理后的车牌图像

 

5.1 预处理后的车牌图像

(3)对车牌图像进行字符分割和归一处理,分割函数如下,function e = qiege(d)

e表示提取的字符区域,d表示车牌图像数据。通过函数function [word, result] = getword(d)得到分割后的字符,然后在用IMRESIZE 函数将每个字符归一大40*20的大小。

 

          5.3 分割和归一化后的车牌图片

4)对每个字符进行模板匹配的过程,将分割出来的每个字符与模版库里的模版pattern(n).feature进行匹配,得到识别的结果,该结果通过一个提醒对话框显示出来。

 

5.4 车牌识别结果

实验中,将所拍摄的16张汽车图片经过该系统测试后,对识别结果进行了统计,其中14张照片能准确被识别,2张照片被误识,正确率为87.5%。对错误图像进行分析后,发现被错误识别的车牌是由于拍摄角度倾斜,被系统的算法没有采取倾斜矫正的措施,所以此种情况不属于算法引起的误检。

结论及展望

本论文中车牌识别系统,首先是根据车牌的颜色来进行车牌的定位,然后,对定位后的车牌区域,进行灰度化二值化的处理,分离了字符与背景;再利用垂直投影法对车牌字符进行分割和字符归一化处理;最后使用模版匹配法进行车牌的字符识别。整个过程中,本文对车牌识别的关键技术进行了分析研究和实现,该算法的实现比较简单,处理时间短,识别率比较高,本系统的有一定实用价值。

但是本文对定位后的车牌图像,没有采用车牌倾斜矫正算法对车牌图像进行矫正,由于在实际的监控系统中,摄像机不可避免的与汽车会存在一定的夹角,导致拍摄的车牌图像不可避免的存在某种程度的倾斜,所以如果用本文算法对这种倾斜车牌进行识别效果变的很差,应单独作为研究内容,重新考虑,这是课题最需要完善的地方。

第一章 绪论

1.1 研究背景和意义

随着我国高速公路的迅猛发展和汽车数量的不断增加,道路交通与车辆管理问题日益严重,突出呈现违章车辆增多,车辆通行费的大量流失,交通环境污染不断加重等一系列问题。智能交通系统(Intelligent Transportation System,简称 ITS)是近年来国际上飞速发展的新兴产业,其应用领域贯穿整个交通运输的全过程。其目的就是利用高性能、高效率的计算机、自动化等科学技术提高交通利用率、缓和道路堵塞、减少交通事故等。目前,世界上经济发达国家的一些城市及高速公路系统已经有商用智能交通系统产品来辅助管理交通运输。

ITS 在国内的发展相对起步较晚,直到 90 年代后才逐渐被提起。虽然起步较晚,但因为国际上关于 ITS 的研究已经较为深入,有不少的成功经验对国内的发展有着重要的参考价值和指导意义。目前,在我国的一些一线大城市已经装备了ITS 的产品。可以说,ITS 在我国已经进入了一个快速发展期。汽车牌照的自动识别(License Plate Recognition LPR)是 ITS 的一个重要组成部分和关键技术之一。

一般可分这样几个子系统:车牌图像采集系统,负责采集获取实际情况下的各种车牌图像1。车牌识别软件子系统,其主要任务是对采集获取的车牌图像中的车牌进行定位、分割、字符切分、字符识别等工作,是车牌识别系统的关键部分。结果处理子系统,对完成识别的车牌进行处理。如各种检测、追中、查找等。它综合了计算机视觉、人工智能、光学、模式识别、自动控制等多种科学技术,有着极为广泛的应用价值。

1.2 研究现状

对于车牌识别系统的研究已经日趋成熟,也有不少较成熟的产品已经应用于实际交通管理。但是这样的系统多是在汽车静止状态下进行工作的,如高速公路的收费站、停车场入口和出口等。对高速运动中的汽车牌照进行准确的自动识别,是目前进一步提高车牌识别系统(LPR)在实际情况中应用价值的方向,也是目前车牌识别系统仍然还在进行研究和完善的关键原因之一。

20世纪90年代初,国外的研究人员就开始了对汽车牌照识别的研究。以色列Hi-Tech公司的 see/carsystem系列,新加坡OPtasia公司的LPRS系列都是比较成熟的产品。其中vLPRs产品主要适合新加坡的车牌,Hi-Tech公司的 see/Carsystem有多种变形的产品来分别适应某一个国家的车牌。 see/CarChinese系统可以对中国大陆的车牌进行识别,但都存在很大的缺陷,而且不能识别车牌中的汉字,另外日本、加拿大、德国、意大利、英国等各个西方发达国家都有适合本国车牌的识别系统2

国内在90年代也开始了车牌识别的研究。目前比较成熟的产品有中科院自动化研究所汉王公司的“汉王眼”,亚洲视觉科技有限公司、深圳吉通电子有限公司等也有自己的产品,另外,西安交通大学、上海交通大学、清华大学、浙江大学等也做过类似的研究3

1.3论文的结构

本文以数字图像处理和模式识别的现状为基础,对车牌图像预处理、车牌定位、字符分割以及字符识别等技术进行了研究。

第一章是绪论,主要介绍了车牌识别系统的研究背景、研究现状,及本论文的主要工作。

第二章主要研究车牌图像预处理算法。本章介绍的预处理算法包括对彩色图像车牌定位算法、灰度化处理、二值化、图像增强等预处理算法,最后得到符合分割要求的车牌区图像。

第三章主要分析了车牌字符的特点,在字符具有尺寸、排列特点等先验条件下采用垂直投影法实现字符的分割。

第四章主要研究研究字符识别算法。本章首先介绍了几种字符识别方法,经过对比,选择了模版识别算法并对其工作原理进行了详细的研究。

第五章为实验结果,并对系统的性能进行验证,并对实验结果及误差进行了简单分析。

最后一章总结了本文的工作,并对下一步研究工作做出了展望。

 

第二章 彩色车牌的定位及预处理算法

2.1 常见车牌定位方法

根据车牌的不同特征,人们提出了各种定位的方法。目前,主要通过两条技术路线进行车牌定位的研究4】【5:一类是基于灰度图像处理技术,另一类是基于彩色图像处理技术。

2.1.1 灰度特征法

Barroso 用穿过车牌区域的水平直线,其灰度呈连续峰、谷、峰分布这一特征来实现车牌定位。该方法通过统计穿过图像水平线的灰度分布图中波峰、波谷的个数来确定车牌的大致区域;LSalgadoYuntao cui 等都提出根据牌照区域中灰度或颜色的变化频率高低来确定牌照区域;王少杰也利用字符区域的水平和垂直投影呈连续的峰、谷、峰这一特征来提取货运列车中的字符区域。

2.1.2 基于边缘检测的提取方法

图像的边缘是指在灰度级上发生急剧变化的区域,而在背景或者物体的内部这种灰度的变化是比较平缓的。边缘检测的任务是精确提取边缘和抑制噪声。能够进行检测的方法有多种,如Roberts边缘算子、Prewitt算子、Sobel算子以及拉普拉斯边缘检测。这些方法正是利用了物体边缘处灰度变化剧烈这一特点来检测图像的边缘。各算子对不同边缘类型的敏感程度不同,产生的效果也不同,经过大量实验分析可知,Roberts边缘算子是一种利用局部方差算子寻找边缘的算子,提取比较精确,Prewitt算子和Sobel算子对噪声有一定的抑制能力,但不能完全排除伪边缘,拉普拉斯算子是二阶微分算子,对图像中的阶跃型边缘点提取准确且具有旋转不变性,但容易丢失一部分边缘的方向信息[lsl,同时抗噪能力较差。所以针对不同的环境和要求,选择合适的算子来对图像进行边缘检测才能达到好的效果。

2.1.3基于纹理特征分析的方法

传统的纹理特征分析提取算法大多基于灰度图像来分析的,所以在车牌提取以前,需要对图像进行预处理,将彩色图像转换为灰度图像。纹理分析算法描述如下:首先进行行扫描,找出图像中每一行所含有的车牌线段,记录下它们的起始坐标和长度。如果有连续若干行均存在不少于一个的车牌线段,且行数大于某一确定的闽值,则认为在行的方向上找到了车牌一个候选区域,并确定了该候选区域的起始行和高度。在已找到的可能存在车牌的区域做列扫描,以确定该车牌候选区域的起始行和高度以及起始列坐标和长度。由此确定一个车牌区域。继续在其他可能存在车牌的区域寻找,直至找到所有的车牌候选区域。

2.1.4 基于彩色图像的车牌定位方法

彩色车牌图像包含的信息明显多于灰度图像,随着计算机处理速度的提高,利用颜色信息可以更有效地实现车牌定位。同时车牌颜色也是车辆分类的一个重要参数,相同的车牌号码可能存在不同车牌颜色的情况,也就是根据车牌号码和车牌颜色才能唯一标识车辆。

根据车牌底色等有关的先验知识,采用彩色像素点统计的方法分割出合理的车牌区域。CCD 拍摄的彩色图片的像素点通常是采用 24 RGB 表示。但R G B 3 个分量之间有很高的相关性,直接利用这些分量常常不能得到所需的分割效果。比较接近人对颜色视觉感知的是色度,饱和度和亮度(HSI )空间。其中I 表示颜色的明暗程度,H 表示不同的颜色,S 表示颜色的深浅,I 分量与颜色信息无关,H S 分量与人感受彩色的方式紧密相连。所以需要把图像从RGB 空间转换到HSI 空间,它们之间的转换关系如下:

                           2.1

      2.2

李文举提出:中国的车牌的字符和背景具有固定的颜色搭配(共包含四种:蓝底白字、黄底黑字、白底黑字或红字以及黑底白字),也就是说车牌字符边缘两侧像素的颜色具有固定的搭配。基于它,对车牌进行定位,可以去掉不符合车牌底色的非车牌区域,而且能够将车牌底色退色或虽具有和车牌相似的几何及纹理特征但不符合颜色特征的伪车牌剔除。Xifan Shi 等基于RGB HLS 两种模型把车牌颜色分为13种,也实现了车牌的定位。高朝晖等使用特征函数进行颜色分类处理,以蓝底白字车牌为例,把颜色分为蓝色、白色和其他三种;然后通过扫描线粗搜索车牌区域(步长较大);再通过设定阈值(扫描线间隔)精搜索车牌位置;最后采用信息融合技术,结合车牌区域的长宽比,字符区域的长宽比和背景色比例(车牌背景颜色占车牌区域比例)等特征,去除干扰区域,正确检测并定位出车牌区域。

本文的车牌定位就是采用基于颜色的定位方法,适用用蓝底白色的车牌,经过反复的试验确定R分量的像素值在小于60G分量的像素值在4172之间,B分量的像素值在119142之间,则认为该区域为车牌所在的区域,然后统计该区域的蓝色像素点的个数,在车牌的XY方向均做此处理。图2.1和图2.2分别为原始的车牌图像和定位后的车牌图片,

 

2.1 原始的汽车图片

 

2.2 定位后的车牌图片

2.2 彩色图像的灰度化

我们采集的车牌原始图像是彩色图像,由于这种图像包含大量的颜色信息,每个像素都具有 3 个不同的颜色分量 RRed)、GGreen)BBlue),这样的图像占据的存储空间很大,而灰度图像是指 RGB 分量都相同的一种特殊的彩色图像,一般1个像素点的变化范围为 256 种,即只含有亮度信息,形成了以亮度为层次的灰度图像。灰度值大的像素比较亮,反之较暗,灰度图象相对于彩色图像可以大大节省存储空间。颜色的三个分量分别用 RGB 表示,像素点的灰度值为 Grey,图像灰度化可采用下面方法实现6

         2.3

在转换的过程中,利用式(2.3)图像往往会出现一定的损失,所以又称有损转换(见图 2.2 2.3 的效果对比)。

 

2.3 灰度化的车牌图像

Copyright © 2008-2020 学术论文网 版权所有 粤ICP备16093775号