毕业论文查重检测原理是什么?

作者:PaperPP  日期:2019年01月28日

  在知网进行毕业论文查重中,检测系统只能识别文字部分,论文中的图片、word域代码、mathtype编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。

毕业论文查重检测原理是什么?

  在知网上的论文检测为整篇的进行上传但是本人却是提交自己的正式论文部分上去的(paperpass),上传的文章格式对检测结果可能会造成影响(在paperpass上存在两种类型(分别为。doc,。docx),但有的还可以是。txt文件),此影响为几十个字的小段可能检测不出。

  但为什么不可以是pdf或者其他的文档文本格式了?(页面的前端业务逻辑判断就会进行处理)。

  首先来解释一下pdf格式文本与doc/txt/docx等可以直接查重的文本文档进行比较的结果。

  pdf:pdf是由Adobe公司开发的。一般情况下pdf是不支持修改的。

  doc:doc是由微软公司开发的。一般情况下doc都是支持修改的。

  对于数据量过于繁琐的论文比如5万字以上的论文文章,以上问题造成的影响就可以忽略不计的。

  知网的对比文库里不包括书籍,教材等。但有一个问题要注意,当你“参考”这些书籍教材中的一些经典内容时,很可能别人已经“参考”过了,如果出现这样子的情况,那就会被检测到相似。有些同学会说,那我用自己的话去重新写一下,这样就不会被检测到啦。这样的方法,理论上是对的,但实际上是,这些经典的句段,已经有无数的人引用过了,也已经被无数的人通过各种改写的方式引用到论文中去的,所以,要写出一段跟别人不一样的话,还真是有点难度,这个也要拼点运气。

  各位在论文提交到学校之前,一定要自己先到网站查一下毕业论文查重,如果有检测出来相似度较高的片段,自己先改一改。论文修改一次以后,不要以为就肯定能过了,因为知网系统会根据论文内容的不同自动调整着重检测的段落,所以有时候第一次查重的时候是正常的,一模一样的句子,第二次检测的时候会判断为“抄袭”。这也是没有办法的,只能多查多改。

分享到:
在线客服在线客服