如何理解论文查重软件报告中的重复率?

作者:PaperPP  日期:2019年02月27日

  如何理解论文查重软件查重报告的相似率?当一篇文章经论文查重软件检测后,相似率是同学们最关心的结果。因为我们很容易把注意力放在这个表示有问题的数字上,所以新用户通常会问的问题是“什么样的重复率说明有问题?”

  这个问题的答案是,没有一个“神奇的数字”能够告诉你一篇文章是否包含有问题的内容。相似率只是为你提供一个粗略的“总体结果”,以确保你能够直接注意到那些有大量重复的文章,而快速忽略掉几乎没有重复的文章。除此之外,论文查重软件相似率本身不会给你确切的答案,也绝对不能告诉你这篇文章是否有抄袭的情况。

如何理解论文查重软件报告中的重复率?

  为什么会这样呢?

  查阅论文查重报告的重要性

  其实,当论文查重软件评估一篇文章的整体重复率时要考虑到若干因素。

  首先,需要注意的是论文查重软件相似率告诉你的是一篇文章中和其他文章相同(即所谓的匹配)的文字的总量。这个总量可能是由许多较小的匹配组成的。相似率30%有可能是指30%匹配同一篇文章,但更有可能的情况是,这30%是由许多较小的匹配相加而成,这些小的匹配最大都不超过4或5%。这只有在看详细的论文查重报告时才能看出来。

  当然,一篇有6个5%匹配的文章可能和一篇30%都抄自同一篇文章的文章一样有抄袭的问题。不过不看论文查重软件查重报告就没法确定了。

  其次,匹配出现在文章的哪一部分有时比到底有多少文字匹配更重要。例如,某些学科领域的编辑可能不太在意方法部分的重复,因为要描述一个过程也只有那么多的方式。而另一方面,在讨论或结论部分的匹配,尽管它可能只占手稿的一小部分,如果没有适当的引用,也会引起编辑的怀疑。

  同样的,一类文章的可接受的阈值未必适合另一类型的文章:综述文章相似率通常会比研究文章高一些。

  同样需要记住的是在未编辑的手稿中可能存在一些简单地错误而导致查重软件错误地标出存在匹配的部分。

  同样,论文查重软件排除引文功能是通过查找引号。如果作者没有使用引号或是在开头或结尾漏掉一个引号时,系统不会识别出引用的文字,即使编辑们可以通过文章布局和参考文献一眼看出是引用的文字。

在线客服在线客服