文章导读:在新的一年中,各位网友都进入紧张的学习或是工作阶段。网学的各位小编整理了论文怎么写-论文查重(checking)的检测原理是什么(What)?的相关内容供大家参考,祝大家在新的一年里工作和学习顺利!
论文(paper)查重(checking)的检测原理是什么(What)?查重(checking)系统事先根据换行符把文章切分成段落,然后再根据标点符号把段落切分成句子,再把每个句子分别进行查重(checking)检测。论文(paper)的查重(checking)粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。目前句子相似度只有文字上的对比,不考虑语义上的相近。如果做到语义上的查重(checking),那我们就没法改重了。
总体相似度 = 相似字数 / 检测字, 被系统自动识别出来的非正文部分(如目录,标题,公式,图表,参考文献等)不参与检测,检测字数一般略小于论文(paper)字数。相似字数 =(句子1字数 * 句子1相似度 + 句子2字数 * 句子2相似度 + …… + 句子n字数 * 句子n相似度),句子相似度范围0.00~1.00,绿色句子相似度按照0计算。
任何一个查重(checking)系统的数据库对比范围都是有限的,所以可能存在虽然论文(paper)抄袭了,但是系统没有找到相似来源的情况