本文主要为广大网友提供“WPS软件中中英文只能核对判断系统”,希望对需要WPS软件中中英文只能核对判断系统网友有所帮助,学习一下!
客服咨询,网学网竭诚为您服务,本站永久域名:myeducs.cn |
3.1.1 最大正向匹配法 最大正向匹配法(Maximum Matching Method)通常简称为MM法。其基本思想为:假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前字串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字段中的最后一个字去掉,对剩下的字串重新进行匹配处理…… 如此进行下去,直到匹配成功,即切分出一个词或剩余字串的长度为零为止。这样就完成了一轮匹配,然后取下一个i字字串进行匹配处理,直到文档被扫描完为止。 4.2 英文一致性判定的实现 根据以前的英文版本测试工作的工作内容,我们把英文版本中一致性错误归类如下: 1、英文版本中出现了其它语言字符,如:出现“编辑”; 2、出现全角标点符号,如:“,”,“……”等; 3、英文单词的拼写错误,如:“Number”错拼为“numher”。 4.2.1 英文字符一致性判定的实现 英文字符一致性判定的实现比较简单,在本文2.4节中已有介绍,详细过程可参照图2.2。根据该过程可以解决错误类别1,2; 4.2.2.2 结合散串 对文本中连续出现的单字词我们称之为散串。通过对真实的文本进行分析,能够发现,文本中的错误处多出现散串,且散串的长度较大。如: 女人 比 男人 爱 吃 零食。 女人 比 那 人 爱 吃 零食。 第二个句子中“男”字错为“那”,导致散串的长度由二变为五。 另外,散串中常包含单独成词概率较小的字。汉语中,有些字不能够单独成词,如“囱” 字只能和“烟囱”构成词,如果这样的字单独出现,则文本中一定有错;有些字很少单独成词,如“保”字,常和“保持” 、“保护” 、“保证”等词共同出现,单独成词的情况很少。我们可看到散串为确定文本中的错误提供了两个有价值的信息:长度和单字词的频率。为充分利用这两个信息,查错时,先对句子中的散串进行分析,根据散串中的信息,给出该处有错误的概率。 |
本站发布的计算机毕业设计均是完整无错的全套作品,包含开题报告+程序+论文+源代码+翻译+答辩稿PPT |
本文选自计算机毕业设计http://myeducs.cn |