临近2023届毕业季,
论文查重率开始使同学们变得焦虑,近年来,论文抄袭等学术不端行为,严重困扰着高校师生。下面paperpp就为大家介绍论文查重率多少算抄袭?认定标准是什么决定的?
论文查重率多少算抄袭?认定标准是什么决定的?
学生提交论文前自己会主动出钱检查重复率(简称“查重”),导师在指导学生论文时,也将“查重”的问题放在第一位。“查重”产业在高校周边蓬勃发展,绝对不是一件好事。尽管学生论文“重复率”降低了,但是论文质量也明显下滑了。
为此,我们不仅要问:(1)现有的知网“查重”,对论文而言,采用的“查重”方法是否合理?(2)基于“查重率”基础上的“抄袭”认定的标准是否合理?
一、“抄袭”的认定标准
抄袭的形式:(1)有原封不动或者基本原封不动地复制他人作品的行为;(2)改头换面后将他人受著作权保护的独创成份窃为己有的行为。
前者一般被称为低级抄袭,后者被称为高级抄袭。低级抄袭的认定比较容易。高级抄袭需经过认真辨别,甚至需经过专家鉴定后方能认定。
而知网
论文检测,主要针对的是低级抄袭。
以四川大学为例,针对论文学术不端行为,规定了“论文抄袭的认定标准”,以及“抄袭程度的认定”。
(一)论文抄袭的认定标准
1.连续引用他人作品超过200字,而未注明出处。
2.使用他人已经发表的数据、图表等内容未经授权或未注明出处的。
3.原文复制或通过改变个别单词、词组及重排顺序复制他人作品内容超过本人所撰写总字数15%的(引用法律法规、政府公文,实时新闻,名人名言,经典诗词,古籍书,公认的原理、方法和公式,通用数表等内容除外)。
4.将文献直接翻译或在翻译中改变字词、重排句子顺序等用于自己的论文中,且总字数超过本人所撰写论文总字数的15%。
5.照搬他人论文或著作中的实验结果及分析、系统设计和问题解决方法而没有注明出处或未说明借鉴来源的。
(二)抄袭程度的认定
已认定为抄袭行为,且重复内容占本人总字数比例在30%以内的,认定为轻度抄袭;30~50%中度抄袭;超过50%严重抄袭。
二、知网“查重”认定
论文查重,是指用一定的算法将需要查重的论文和知网数据库中已收录的论文进行对比,从而检查出论文的重复率。
在知网查重时,黄色的文字是“引用”,红色的文字是“涉嫌剽窃”。剽窃是指在你的写作中使用他人的观点或表述而没有恰当地注明出处。这包括逐字复述、复制他人的写作,或使用不属于你自己的观点而没有给出恰当的引用。
(一)
查重原理
CNKI检测系统是连续的字数相同不能超过13个字,万方检测系统是连续的字数相同不能超过15个字。否则就会标注出来,算进重复率。
知网检测系统的灵敏度设置了一个阀值,该阀值为5%,以段落计。低于5%的抄袭或引用是检测不出来的。
(二)知网系统计算标准:
问题1.文字复制检测
学术不端的各种行为中,文字复制是最为普遍和严重的。目前知网检测系统对文字复制的检测已经达到相当高的水平,对于图表、公式、数据的抄袭和篡改等行为的检测,目前正在研发当中。
问题2.查重率的认定
百分比只是描述检测文献中重合文字所占的比例大小程度,并不是指该文献的抄袭严重程度。只能这么说,百分比越大,重合字数越多,存在抄袭的可能性越大。是否属于抄袭及抄袭的严重程度需由专家审查后决定。
问题3.最小检测单元的确定
知网检测系统有句子、段落两者检测单元。句子有句子级的相似算法,段落有段落级的相似算法,计算一篇文献,一段话是否与其他文献文字相似,是在此基础上综合得出的。
推荐专题:《知网论文查重怎么操作》
三、存在的主要问题
实际上,在知网检测系统中,对一篇需要检测的论文进行查重,不是将需要检测的这篇论文,与某位著作权人的某一篇论文进行比对,而是从数据库进行检索。
如一篇硕士论文,作者参考了120篇之前发表的论文。作者分别借鉴了120篇论文的不同“句子”,字数在50~180字之间,总共引用了1.5万字。而该篇论文总数只有3万字,很明显,重复率高达50%。也就是说,采用现有的知网检测系统检测到的重复文字1.5万字,尽管来自于120篇论文资料。按照现有的“抄袭”的评定标准,已经构成严重抄袭。
但是,在现实中,如果一位研究生在撰写论文时,认真阅读了120篇以上论文,并根据自己写作的需要,引用到自己的论文中,主题明确,结构合理,层次分明,语句通顺。这应该评为优秀论文,而不应该归类于抄袭。
为什么检测结果会与人们的认知出现这样大的偏差?
主要原因何在?
(一)一对一的比对
著作权法在维权保护中,为保护作者的权利,采用的是将涉嫌侵权的作品A与权利人的作品B进行比对。也就是说,是将作品A与作品B直接进行比对,从而得到二者之间的重复率。
(二)一对N的比对
现有的知网检测系统,在论文查重检测中,采取的检测方法是将论文A与数据库中的所有论文分别进行检测,从而形成论文A与数据库中的论文B、C、D、E、F、G、H……进行检测比对。也就是说,是将一篇论文A与数据库中N篇论文进行比对,其重复率叠加在一起,形成总的重复率。
很明显,两者采取的检测方法不同,检测结果会明显不同。为此,根据检测结果,来认定是否“抄袭”,显然会存在有问题。
四、对
论文查重的建议
改变现有知网检测系统的方法,将现有的论文A与数据库中的论文B、C、D、E、F、G、H……分别进行比对,更改为A~B、A~C、A~D、A~E、A~F、A~G、A~H……,形成重复率:a、b、c、d、e、f、g、h……。只要重复率a、b、c、d、e、f、g、h……中都没有超过某一个阈值,如5%,就不应该认定为“抄袭”。
也就是说,改变现有的“总重复率”,为单篇论文的“重复率”,更为合理,更为科学,也更能体现著作权保护的立法宗旨。
一方面,为现有的学生减负,更为重要的是为老师们减压。
(曾德国,西南政法大学司法鉴定中心)
特别声明:本文转载自网络,仅仅是出于传播分享信息的需要,如果作者不希望被转载,请与https://www.paperpp.com/联系!
800万大学生都在用的免费论文查重平台
本文由PaperPP论文查重系统原创,转载请注明出处:https://www.paperpp.com/info/12108
.html