摘要
随着计算机技术的发展和信息技术与课程的整合,信息化教育越来越受到人们的关注。多媒体教学的使用,迫切需要将传统的键盘输入转化为手写输入以提高课堂的教学效率。但由于手写数学公式本身的特点,如数学符号的相似字符较多,而且一些比较复杂的数学公式存在着上/下标的定位问题,导致了手写数学公式的识别会相对困难一些。 一个手写的数学公式识别系统,总体上分为字符识别和公式的结构分析两个主要的步骤。其中,字符识别是公式识别的基础。字符识别分类器的设计直接影响到识别系统的识别率。而结构分析是公式识别的关键。 本文第一章介绍了数学公式的研究背景,国内外的研究现状以及相关的一些商业化的产品,介绍了数学公式识别的一般步骤以及本文所做的工作。 介绍了一般数学符号的预处理和特征提取,以及本文所提出的预处理方法和边界特征提取方法和变换进行高维空间的降维,和一些常用的字符识别的一些方法,提出了组合分类器的思想,以及本文所用的最小距离分类器和改进的神经网络算法对数学符号的识别,目的是在能够识别数学公式的基础上,增加了学习的功能,以便今后识别能力的扩展。然后对数学公式识别的结构分析和数学公式的输出做了阐述。主要介绍了自己如何设计并实现印刷体数学公式识别系统,提出了自己的设计思路与模块划分并编写程序实现。
本文对公式分析与识别部分做了较深入的研究,主要从以下几个方面进行了改进:
在公式字符识别阶段,针对公式自身的特点,提出了一种基于连通域搜索的公式字符切分算法,并通过公式字符识别结果的反馈信息对粘连字符实行切分,以改善字符分割的质量,在实验中采用该切分算法取得了比较好的效果。
在公式结构分析阶段,以公式字符的识别结果为基础,根据字符的结构布局,采用“自顶向下”和“自底向上”思想相结合的策略对数学公式进行结构分析。构建数学公式的符号关系树。
关键词:公式识别,二维语法,数学公式识别,结构分析
ABSTRACT
...
KEYWORDS: formula recognition, two-dimensional grammar, mathematical formula recognition, structure analysis
目录
摘 要II
ABSTRACTIV
第1章 前 言1
1.1课题研究的背景和意义1
1.2国内外公式识别研究状况和进展2
1.3数学公式识别技术所要解决的问题以及采用的方法3
1.4数学公式识别技术研究取得的成果及意义4
1.4.1符号识别的方法4
1.4.2符号分割5
1.4.3分隔符的识别5
第2章数学公式识别系统概况6
2.1数学公式的特点6
2.1.1数学公式中的符号6
2.1.2数学公式的运算符号6
2.1.3含义的不确定性7
2.2数学公式识别系统的组成结构7
2.3数学公式识别的难点9
第3章 数学公式识别的相关技术10
3.1图像预处理10
3.1.1图像的二值化处理10
3.1.2图像的平滑去噪10
3.1.3图像的细化11
3.2常用的几种字符切分方法11
3.2.1基于结构分析的切分12
3.2.2以识别为基础的切分12
3.3粘连字符的切分14
3.3.1基于外部特征的粘连字符切分14
3.4数学公式识别中常见的错误14
第4章 公式分析与识别16
4.1公式字符识别16
4.1.1预处理16
4.1.2公式字符的切分17
4.1.3公式符号归一化23
4.1.4公式字符的识别23
4.2 公式结构分析25
4.2.1结构分析预处理25
4.2.2结构信息预处理26
4.2.3公式结构分析算法的实现30
4.2.4公式结构分析结果31
第5章 总结34
5.1论文总结34
5.2下一步工作34
致 谢36
参考文献37
毕业设计小结40