《使用《学术不端文献检测系统》的几点体会.ppt》由会员分享,可在线阅读,更多相关《使用《学术不端文献检测系统》的几点体会.ppt(22页珍藏版)》请在三一办公上搜索。
1、使用学术不端文献检测系统的几点体会,李家永中国科学院地理科学与资源研究所 研究员资源科学专职副主编、编辑部主任,目前流行的文献检测系统国外的主要有:Turnitin(turn it),iParadigms(1996 启用,2009亚洲版 Originality Checking allows educators to check students work for improper citation or potential plagiarism by comparing it against continuously updated databases.)CrossCheck,CrossRe
2、f与iParadigms(抄袭检测平台,Thomson和Elsvier应用其进行投稿论文检测)MyDropBox,Sciworth(使用Microsoft搜索技术,可检测互联网资源、可公共存取的部分数据库以及可链接的某些机构内部文档),目前流行的文献检测系统国内的主要有:ROST反剽窃(文档相似性检测)系统,武汉大学信息管理学院 沈阳(将文档切割为若干50-200字(可自定义)小文本,通过混合引擎将其与188亿个网页和490万篇文献进行模糊匹配,标示出相似文本块,支持PDF、DOC、PPT、XLS、TXT等格式的文档)学术不端文献检测系统 清华大学中国学术期刊(光盘版)电子杂志社(以CNKI文
3、献库为基础,应用数据库技术、索引技术、中文处理技术、中文比对技术等集成,目前有科技期刊、社科期刊、学位学位3个系统,支持DOC、TXT等格式的文档),学术不端文献检测系统试用协议甲方:乙方:同方知网(北京)技术有限公司 为提高对学术不端文献的辨别和处理能力,甲方申请试用乙方开发的“学术不端文献检测系统”(下简称“检测系统”)。经过友好协商,乙方许可甲方试用并签订如下协议。第一条 权利与责任一、乙方许可甲方试用此检测系统。甲方只限于检测 的文献,不得检测其他任何文献。二、对于甲方利用此检测系统作出的关于文献的任何性质认定,乙方不承担任何责任。三、如果甲方公开使用检测系统获得的检测结果、检测数据,
4、其后果由甲方负责。四、乙方就甲方使用此检测系统提供技术支持和相关服务。五、试用结束后,甲方有义务将试用情况以书面形式反馈给乙方。第二条 知识产权 甲方应充分尊重乙方著作权,不得进行软件解密,也不得以任何方式向任何其它单位和个人转让此检测系统的使用许可,否则乙方有权要求甲方赔偿经济损失。第三条 期限 第四条 其他,相关概念对比范围:确定的比对数据库和时段。重合字数:被检测文献在对比范围内,与他文句子重合、数字重合以及相似文本块的字数总和。文字复制比:被检测文献重合字数与该文总字数的百分比。单源复制:复制的文字来源于单一文献(多为自抄)。多源复制:复制的文字来源于多篇文献。前部重合度:引言、方法、
5、区域概况等部分的文字复制比。后部重合度:结果与分析、结论等部分的文字复制比。未 检 出:文字复制比 100字,大段落连续 重合字数200字。整体抄袭:文字复制比 80%。,资源科学文稿检测概况比对范围:1 中国学术期刊网络出版总库(收录 8200多种期刊)全文数据库;2 中国博士学位论文全文数据库;3 中国优秀硕士学位论文全文数据库;4 中国重要会议论文全文数据库。时段选取“全部”上网文献,资源科学文稿检测概况2009年1月8日 9月30日共上传自由来稿1068篇(其间所收专栏文稿54篇和部分质量很差直接退稿的未上传);检测1064篇(其中4篇检测未果);未检出复制文字的517篇,占48.6%
6、;检出复制比3%的547篇,占51.4%。,48.59%,几个典型案例自抄学位论文92%互抄(课题组内)80%多源抄袭52%伪造数据24%抄结论23%引文复制20%(总字数10602,重合字数2074)抄数据6%(总字数7547,重合字数452),几点体会一、检测系统为界定引证、抄袭和剽窃提供了非常实用的技术手段。从使用情况来看,检测结果绝大部分是客观的,多数情况下,当一篇文稿的文字复制比20%时或多或少有些问题,40%时多为自抄(包括团队内部自抄)或重复发表。但检测系统仅仅是一个很有用的工具,复制或转意复制的情况非常复杂,不宜将复制比的高低作为抄袭定性的依据。,二、恰当引证是知识传承过程中的
7、一个重要环节,应当鼓励正常的引用前人成果和正确使用参考文献,特别是综述和评论性文章,必要的复制是需要的,关键是摘抄是否合理和有无故意伪引,特别值得指出,复制率高低与创新性强弱没有必然的联系。此外,对于青年学者,特别是硕士研究生等新入门的学者和缺乏写作经验的学者来说,他们需要有一个学习和临摹的过程,也有对学术规范的认识过程,因而必须注意区分故意抄袭和临摹效仿在性质上的不同。,三、不同的期刊和不同类型的文章对引用、复制和抄袭的界定标准应有所不同。以报道最新研究成果为主的学术期刊应严格要求,以实用性为主的应用性技术期刊不宜过分强调,以综述、评论为主的期刊必须要求适当的引文量。同时,复制多少合适还与期
8、刊稿源相关,稿源好可要求严一些,反之则宽一些。报道实质性研究成果和发布数据资料严一些,综论、综述、评论宽一些。,四、造假和剽窃是最恶劣的学术腐败行为,危害性极大,必须旗帜鲜明地加以反对和遏制。造假包括编造数据和事实,也包括使用二次或三、四次文献无限外推和先入为主加工数据与事实。剽窃是指没有参与课题或者没有参加实质性研究工作而占用他人成果,并且发表文章时故意隐瞒事实的行为。,五、由于数据库不够完备,文献经多次转抄后,检测可能给出错误信息,并且可能凸显版权纠纷,反而加大稿件处理的难度。例如,某高工投给本刊的一篇稿件被检测出抄了某研究生的学位论文,而作者在收到退稿通知后来信说,该学位论文是在他的指导
9、下完成的,学生先抄了他的会议文章。经查证,该作者反映的情况属实,但因这篇会议文章未入库,检测系统无法追踪,其结果必然是错误的。,类似的还有大量的图书、文件、内部资料等等在目前并没有被收录到相关的检索系统数据库中。尊敬的编辑:您好。感谢您百忙之中就稿件问题予以答复。看了附件的资料,情况基本清楚。拙文是基于我与另一研究者在西部蓝皮书:_(社会科学文献出版社出版,我记错了)的基础上修改的。该书05年出版(ISBN:XXXXXXXXXX)。去年年底因课题需要,我对文章做了些修正,但因为个人疏懒,一直拖至近期才向贵刊投稿。看了您提供的几位作者的论文,的确惊人“相似”,作为原创者,我对文章内容的来源还是自
10、信的。这几人的文章发表时间显然晚于西部蓝皮书,我不敢妄称他人抄袭这本书,但这个事情的确令人哭笑不得。所投文章不敢自誉,但的确是本人与合作者一点一滴积累而成。因地处偏僻,资料信息来源不畅,这个问题的确还是我第一次碰到。如条件允许的话,我打算和这几位作者联系一下,“交流”情况。我对贵刊严格审核文章的工作态度表示敬意,也希望向编辑说明真实情况,稿件弃留,烦请编辑斟酌。叨扰了。,六、学术期刊不仅是传承知识的载体,而且在维护学术评价公平、公正方面起作重要作用,做好学术期刊是学术共同体的共同责任。“检测系统”的确为识别和遏制抄袭行为提供了有力的技术支持,但具体情况还需要具体分析,在这一点上计算机不可能代替人,同行评议和审稿仍然十分重要,特别是对研究成果创新性的判断必须由具有相关知识和识别能力的专家来完成。,小结检测系统是一个非常实用的工具;不宜用复制率高低判断文章的优劣;恰当引证和复制是写好文章所必需的;不同期刊不同文章对复制率要求不同;造假和剽窃是最恶劣的学术腐败行为;受数据库限制检测结果也可能出错。,做好学术期刊需要学术界共同努力!,