摘要
光学字符识别技术是计算机自动、高速地辨别纸上的文字,并将其转化为可编辑的文本的一项实用技术。它通过扫描和摄像等光学输入方式获取纸张上的文字图像信息,利用各种模式识别算法分析文字形态特征,判断出汉字的标准编码,并按通用格式存储在文本文件中。它是新一代计算机智能接口的一个重要组成部分,也是目前世界前沿研究课题模式识别领域的一个重要分支。文字识别技术的研究涉及图像处理、人工智能、形式语言、自动机、统计决策理论、模糊数学、信息论、计算机科学、语言文字学等学科,它是介于基础研究和应用研究之间的一门综合性科学技术。
本文首先研究了图像输入和预处理,将采集的图片进行二值化、为了能够分析图片中的内容,研究了投影法、连通域法、膨胀算法来分析版面内容,接下来进行了字符切割的研究,将图片中的字逐字进行切分,最后通过提取字符特征,将图片中的文字识别出来。
本文的研究对于自动化识别文字、牌照识别等具有一定的指导意义。
关键字:光学字符识别,模式识别,文字识别
Abstract
...
Keywords: optical character recognition, pattern recognition, text recognition
目录
第一章 绪论1
1.1 文字识别技术的历史与应用1
1.1.1 文字识别技术历史1
1.1.2 文字识别技术的应用2
1.2 文字识别系统的构成2
1.3 文字识别技术4
1.3.1 统计模式识别方法4
1.3.2 结构模式识别方法5
1.3.3 人工神经网络5
1.4 存在的问题6
1.5 本文的组织结构6
第二章 图像输入和预处理8
2.1 图像输入8
2.1.1 图像输入技巧8
2.2 文字预处理10
2.2.1 二值化10
2.2.2 去除噪音13
2.2.3 倾斜矫正13
第三章 版面分析15
3.1 版面分析方法15
3.1.1 投影法16
3.1.2 连通域法18
3.2 版面块分析21
3.3 基于膨胀算法的版面分析24
3.3.1 膨胀运算24
3.3.2 算法过程25
3.3.3 膨胀尺寸的选择27
第四章 字符分割29
4.1 双语混排名片识别系统29
4.2 混排字符切分算法分析30
4.2.1 文本块粗切分30
4.2.2 字符类型判定32
4.3 基于字间距周期和反馈的字符切分算法33
4.3.1 中英文字符的周期性34
4.3.2 中文字符连通区域的分离35
4.3.3 汉字部件的分离与合并36
第五章 特征提取41
5.1 特征提取41
5.1.1 字符特征提取的方法41
5.1.2 基于字符骨架的两级初分类42
5.2 单字识别46
5.3 后处理47
第六章 全文总结48
参考文献49
致谢52
毕业设计小结53