蒙古文字识别之分类器的设计:蒙古国恢复传统蒙文
摘要:文字识别分为联机手写识别和脱机手写识别,其中联机手写识别是通过数字设备采集手写输入信号,然后根据文字特征加以匹配识别的过程。但是由于手写体笔迹变动非常大,精确识别比较困难。针对这种情况,我们提出一套手写体蒙古文字识别多分类器的设计,依次采用了贝叶斯(Bayes)决策方法、判别函数法,以及HMM模型与最近邻方法等。显著提高了系统的识别率和正确率。
关键词:蒙古文字;分类器
中图分类号:G305 文献标识码:B 文章编号:1674-9324(2012)07-0138-02
一、引言
蒙古文字识别属于模式识别领域,在我国模式识别学科还在不断地发展,人工神经网络和各种新的最优化技术在模式识别中的广泛应用,以及作为统计模式识别基础的文字识别技术的新进展和民族地区的发展需要,都使我们迫切感觉到研究内蒙古自治区的主体民族语言——蒙古文字的识别是多么的重要。蒙古文字识别过程主要分为获得手写体文字特征、书写特征选择和提取、整体分类识别或切分分类识别等关键步骤,其中无论是整词识别还是切分识别,都必须用到分类器,本文重点探讨了其中的一个重要环节分类器的设计。
二、研究内容
为了完成手写体蒙古文字识别的任务并且得到较高的识别率,必须建立一个结构完整、层次清晰、适于搜索的分类器。因此,联机手写体蒙古文字识别技术中的分类器的设计是整个识别系统的核心,是整个开发过程中的最后阶段。为了避免手写体蒙古文字切分后提取到的特征混乱的局面,我们采用两级分类器,对切分后的基元进行分类识别,其识别正确率达到80%以上。主要采用的方法有判别函数法、贝叶斯(Bayes)决策方法以及HMM模型与最近邻方法等,这样可以充分利用蒙古文字的联机和脱机特征建立多分类器,提高识别率。第一层分类器的设计:统计决策(Statistical decision)可以从广义和狭义两方面来理解。凡是使用统计方法而进行的决策,称为广义的统计决策;狭义的统计决策特指风险型决策方法。所谓风险型决策,是指通过人们大量实践和观察后发现,对可能发生的结果(情况)有统计规律可循,并可根据这些规律获得事件出现的概率分布,而决策者在一次抉择过程中,尽管掌握了这种统计规律,但也不可避免地承担一定风险的决策。贝叶斯(Bayes)决策理论方法是统计模式识别中的一个基本方法。常用的贝叶斯决策方法有基于最小错误率的贝叶斯决策和基于最小风险的贝叶斯决策两种,本系统采用第二种方法设计第一层分类器。手写体蒙古文字经过特征提取之后,确定位于字首的基元有22个,字中的基元有18个,字尾的基元有20个。继续判断位于主干线的左边的基元有4个,右边的有5个,位于两边的基元有51个。在选取了特征之后,需要选择或寻找适当的判别准则,从而判断出待设别的文字特征与哪一个类别的特征最近。本系统采用的最小风险贝叶斯决策规则为:
如果R(?坠k|x)=■R(?坠i|x),则?坠=?坠k (2.2.1)
依据上式所得到的X带入下面的线性判别公式中,完成文字特征的第一级分类,线性判别公式如下:?摇
Di(X)=■?棕ikXk+?棕i0 (2.2.2)
式中Di(X)代表第i个判别函数,?棕ik是系数或权,?棕i0为常数或称为阈值。由于文字数量很大,如果不对文字分类而直接识别,一方面识别效果不会好,另一方面计算量往往会很大。所以文字识别通常都要对文字做一级或多极分类,然后再细分判别,从而大大提高识别效率。在本文所探讨的蒙古文字识别一级分类器设计时主要采用了比较简单的基于贝叶斯决策方法的线性分类器,这主要是根据获得的手写体文字特征不够清晰的前提下采用的方法。但是,在实际中有许多模式识别问题并不是线性可分的,尤其蒙古文字是字母和字母之间是连笔写成的,因此根据如此复杂的情况,我们进一步设计了第二层分类器。第二层分类器的设计:在第一层分类器的识别结果上,我们把HMM模型与最近邻方法DTW融合在一起,这是一种有监督学习方法。给定一个训练数据集合,分类算法根据这些标记的数据归纳出一个分类器(或模型),这个分类器可用于预测新的或未标记的数据,即将每个新数据映射到给定类别中的某一个类,这样可以充分利用文字的联机特征和脱机特征,从而进一步提高分类识别的精确率。HMM即隐含马尔可夫模型是一个数学模型,到目前为之,它一直被认为是实现快速精确的语音识别系统的最成功的方法,但近年来,在人脸识别、手写识别等诸多方面也得到了广泛的应用。
分类问题直接与特征提取有关。在有些情况下,所选取的特征决定了粗分类的方法。在我们的系统中首先使用了蒙古文字的一些结构特征进行粗分类,如按照笔画数、起笔点、是否存在主干线、词中的位置等特征进行一级分类,此时要求粗分类的分类稳定性要高、速度要快、特征要简单,要和细分判别方法相协调。再次按照蒙古文字全局结构特征如是否带有回朔笔迹、笔划是否交叉、是否带有圈等特征进行二级分类,也称为细分类过程。因后验概率的估计并不可行,下面把实际的细分类Ci的概率表示为:?摇?摇
P(Ci|Qj(O))=P(Ci|Qj,1(O),Qj,2(O),…Qj,m(O)) (2.2.3)
O是观察特征模式,Qj,k(O)是由分类器j识别的第k个最佳类标记,M取小于N的值,M<
参考文献:
[1]Claus Bahlmann,Hans Burkhardt.“The Writer Independent Online Handwrinting Recognition System frog on hand and Cluster Generative Statistical Dynamic Time Warping”[J].IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,2004,26,(3):75–86.
[2]Alessandro L.Koerich,Rovert Sabourin,Ching Y.Suen.“Lexicon-driven HMM decoding for large vocabulary handwriting recognition with multiple character models”[J]. International Journal on Document Analysis and Recognition,2003,16(6):126-144.
[3]靳简明,江红英,王庆人,等.数学公式识别系统:MatheReader[J].计算机学报,2006,29(11):218-220.
