• <tt id="ys2km"><rt id="ys2km"></rt></tt>
  • <strong id="ys2km"><noscript id="ys2km"></noscript></strong>
  • <input id="ys2km"><wbr id="ys2km"></wbr></input>
  • 學術不端論文查重檢測高校版本專、本、碩、博大學生論文學術不端檢測渠道

    當前位置: 首頁 > 查重資訊 > 查重經驗 > 對已經發表論文的知網查重結果分析

    對已經發表論文的知網查重結果分析

    時間:2018-11-29 23:41:08 編輯:凈溪知網查重

    對已經發表論文的知網查重結果分析

      摘要:知網查重系統的廣泛應用源于現代社會學術誠信失衡的現狀,文章基于大量已發表論文的檢測數據,根據檢測報告判定出作者、系統等諸多因素造成的檢測結果的失真,針對性提出排除影響結果真實性若干干擾因素的應對策略,為圖書館等信息檢索機構、編輯部、檢測系統開發商、職稱部門提供改進意見和建議,客觀、公正、理性評價已發表論文作者的學術水平。 

      關鍵詞: 已發表論文;知網查重;學術不端
      
      1引言 
       知網查重系統的廣泛應用源于現代社會學術誠信失衡的現狀,CNKI論文知網查重系統覆蓋到本科生、研究生、職稱評審、項目申報等各個領域,多個層面。大部分人理解的學術不端檢測都是面向未公開發表的論文。針對已經發表論文的檢測是近年來職稱評審要求的必備條件之一,一旦檢測結果不符合規定標準,不但耽誤晉升職稱,還要喪失學術清譽,因此已發表論文的再次審定對于作者的重要程度更甚于未發表論文的檢測。 
       本文基于大量已發表論文的檢測數據,根據檢測報告判定出作者、系統等諸多因素造成的檢測結果的失真,針對性提出排除影響結果真實性若干干擾因素的應對策略,為圖書館等信息檢索機構、編輯部、檢測系統開發商、職稱部門提供改進意見和建議,客觀、公正、理性評價已發表論文作者的學術水平。 
      2檢測統計結果 
       本文選取的數據來源于CNKI科研誠信管理系統研究中心開發的學術不端文獻檢測系統有關高校職稱論文的檢測結果。 
      表1顯示,一年來,通過CNKI學術不端文獻檢測系統5.0版本檢測論文共計6224篇,檢測結果低于10%復制比的論文占比56.04%,檢測結果低于20%復制比的論文占比73.36%,檢測結果低于30%復制比的論文占比83.92%。所有檢測結果均非系統直接產生的結論,每篇論文的檢測結果都經 
      過專業人員的人工判斷,排除了正當引用、本人已發表文獻正當引用部分、未公開發表的本人博碩士論文等因素,在此前提下統計結果低于10%復制比的論文僅有56.04%的論文通過,低于30%復制比的論文也只達到83.92%的通過率。這一數據現象發人深省,證明已發表論文的再次檢測是完全有必要的。 
      3檢測系統存在的問題 
       基于“中國知網”海量的信息資源,以及其學術不端檢測系統在學術研究、研究生培養、本科教學、項目申報、成果鑒定、職稱評審等諸多領域的廣泛應用,奠定了“中國知網學術不端文獻檢測系統”做為檢測工具的最佳選擇。系統為我們提供科學、準確、全面的數據檢測起到了積極的作用,但其不盡完善之處還需給以高度關注。 
      3.1比對源不全面 
       學術不端檢測系統檢測覆蓋資源范圍包括中國學術期刊網絡出版總庫、中國博士學位論文全文數據庫、中國優秀碩士學位論文全文數據庫、中國重要會議論文全文數據庫、中國重要報紙全文數據庫、中國專利全文數據庫、互聯網資源、英文數據庫、港澳臺學術文獻庫、優先出版文獻庫、互聯網文檔資源等。從文獻類型考慮,資源庫明顯不能達到窮盡所有的資源類型,比如科研最常用到的圖書就沒有包含在比對源里。從單一類型的文獻來看,單一類型資源也無法達到全面收錄。以期刊資源為例,自“維普期刊資源整合服務平臺——期刊地區分布導航”統計顯示全國各省份發行期刊種數共計達14 763種,而中國知網期刊介紹收錄國內學術期刊8 002種,維普期刊資源整合服務平臺與中國知網沒有一家數據商全部收錄中文出版發行期刊種類,二者存在6 761種的差異,因此,從期刊單種文獻類型看,知網檢測系統后臺資源總量顯示明顯不足。 
      3.2論文提取失真 
      針對這些論文的報告單仔細核查,發現問題源于論文提取失真的情形。為了保證發表論文的原始狀態,已發表論文的檢測選擇直接從知網數據庫里提取論文,在檢測實踐過程中發現了有許多結果出人意外,主要體現形式有如下幾個方面: 
      (1)部分提取。檢測論文的時候系統調用數據庫原文有誤,僅提取論文第一頁或者最后一頁,勢必造成檢測結果的片面性,表現為報告單總字數與實際字數差別很大,對應的總文字復制比也是局部的,不能真實反映該篇文章的實際情況。 
      (2)亂碼顯示。系統調用數據庫原文檢測論文,全文報告單出現亂碼顯示,雖然給出了檢測結果總字數,總文字復制比,但是結果明顯是針對亂碼比對的無效結果。 
       (3)轉頁誤讀。為了充分利用每一個版面,編輯部編排文章時如果一篇論文沒有占滿完整的版面,該篇文章所占版面的余下部分會由另一篇文章的轉頁部分補充完整。這樣一篇文章的pdf原文版有部分其他文章的內容在里面。調用這樣的原文進行比對,結果會出現總文字數的增量顯示,相應的總文字復制比也會失真。 
      3.3引用標志未識別 
       (1)“引號”引用標志不識別。有些人撰寫論文的時候經常用到別人的觀點作為自己論文的論據或者支持自己論文的觀點,這部分內容用引號引起來,檢測系統未定義引號為引用識別標志,檢測結果相似文獻列表顯示的是非引用標志,一般做抄襲復制處理。 
       (2)“文字表述”引用方式不識別。有些論文作者在撰寫論文時以行文方式體現了論文的某個部分使用了別人的觀點,檢測系統從語義的角度無法做出判斷,常常定位該部分為抄襲復制。 
       (3)“引用”標志未識別。檢測系統程序設計對做了規范引用標志的論文的引用部分不作為抄襲處理,但是檢測過程中不乏引用標志明顯但系統未識別的案例,屬于不正確的判斷。 
      3.4檢測結果涵蓋參考文獻部分 

       檢測系統設計檢測結果不包含參考文獻總字數,相應的總文字復制比也不體現參考文獻部分,在論文檢測過程中卻出現了參考文獻計算在內的現象。把參考文獻計算在內加大了文獻復制的比率,影響本篇文章正常復制情況的顯示。

      3.5網絡文獻報告列表顯示有誤 
       檢測系統檢測范圍包括互聯網資源,檢測結果中網絡文獻列表的時間僅顯示年份,不顯示具體時間,且時常出現檢測時間范圍之后的文檔列表,針對此類現象,經多篇文章測試,發現這些網絡文獻的顯示基本不會改變總體復制比,但是系統針對網絡文獻在時間上的誤讀雖對結果產生不了太大的影響,但是容易引起作者對報告單的質疑,從而忽略檢測系統的正面作用,無限放大系統的漏洞。 
      3.6檢測結果涵蓋了文章自身 
       有些文章的檢測結果報告單重復文章列表中顯示文章自身,即查重文獻與文章本身重復。排除了原文,文字復制比就下降了。 
      3.7同一論文不同時間檢測結果不同 
       同一篇論文在不同的時間段檢測,檢測結果存在差異。雖然同一篇文章在不同的時間進行檢測,但是鎖定的檢測時間范圍是一致的,出現不一致的結果屬于系統判斷失誤。 
       
      4理性認識檢測系統,充分發揮系統價值 
       要理性使用學術不端檢測系統,充分享有它帶來的便利,同時要正確看待它存在的缺陷,使檢測結果更加公正合理[1]。這是檢測系統經過廣泛推廣使用后大家達成的共識。完善檢測系統功能,提升專業人員的判斷能力,排除系統障礙,最大限度發揮系統價值。從以下三方面考慮,確保檢測結果能夠如實反映論文的真實學術水平。 
      4.1制定檢測標準消除干擾結果正確性的客觀因素,以明確論文的原創性與有效價值 
       論文檢測系統問世的初衷是從技術層面采取遏制學術不端行為。最初應用于論文發表的源頭期刊雜志社,并從編輯部推廣普及。編輯部在使用過程中積累了豐富的經驗,使這一檢測工具在編審環節起到了積極有效的作用。綜合前期多家編輯部和學位論文檢測積累的經驗,加入人們對原創作品的專業理解,制定已發表論文學術不端檢測的標準,排除干擾因素才能保證對每一篇已發表論文給出客觀公正的評價。 
       (1)本人未公開發表的博碩士學位論文、會議交流論文,屬于個人成果但是沒有正式公開發表,本人拿出其中一塊或者做了進一步的完善發表在期刊上不計算在重復范圍之列。 
       (2)引用文獻,論文中用別人的論點支撐本人論文的部分做了規范的引用標志,并在參考文獻中有所體現不計算在重復范圍之列。 
       (3)本人已發表文獻,論文中用到了本人前期成果,在合理范圍內不計算在重復范圍之列。 
       (4)網絡文獻,由于系統原因出現的檢測時間范圍之外的網絡文獻,含博客、文庫、互聯網資源等均不計算在重復范圍之列。 
       (5)投稿或者修回日期與發表日期期間檢測結果顯示有復制的論文,由于任何一篇論文都存在投稿與刊發的時滯現象,檢測結果中出現在這期間的論文不計算在重復范圍之列。 
      4.2加入專業人員人工判斷消除檢測系統的漏洞,以糾正系統檢測裸數據的錯誤因素 
       筆者在大量實踐的基礎上認真分析了論文檢測系統的不盡完善之處,如何糾正、補充、完善系統存在的問題應做如下幾方面的思考。 
       (1) 國內開發的論文檢測系統主要有清華同方、萬方、維普和超星公司的大雅相似度檢測系統,不同廠商開發的檢測系統姑且不論其檢測原理,每個產品依托的后臺數據庫都是自建數據庫,每個數據庫都不可能窮盡所有的資源。同一篇文章使用不同的系統檢測結果不盡相同。作為評價工具,使用一個系統標準對所有人做出評價有失公允。 
       (2) 論文提取失真的根源在于建庫過程的失誤所致,數據庫在建庫過程中難免出現疏漏,疏漏幾率應該有可控制的允許范圍。首先作為系統的開發商針對這一問題應該在以后的數據加工過程中避免這種事故的發生,同時建立倒查機制,無論公司工作人員還是用戶遇到這種情況都鼓勵及時反饋,從源頭上修正以前的錯誤。檢測人員盡可能使用論文發表時的原始版本進行復查,以保證結果的真實可靠。 
       (3)有些論文檢測結果偏差表現在系統對引用標志的未識別,“引號”引用標志不識別,“文字表述”引用方式不識別這三種情況,第一種情況屬于系統具有對規范引用格式的識別功能,個別情況未識別應該不屬于程序漏洞,與數據錄入中的誤差有很大關系,找出此種失誤的例子研究其問題所在,避免類似事件發生。第二、三種情況是普遍現象,屬于系統語義功能的不完善所致,系統應該完善語料庫,增強語義功能,增加這兩種情況的識別度,增進系統檢測的有效度。 
       (4)數字化網絡化環境下互聯網資源是學術造假的主要來源,網絡資源未公開發表,許多人撰寫論文用到BLOG、微博、論壇、文庫等資源,不加注釋,據為己有,作為自己的最新成果發表,因此檢測系統比對源涵蓋互聯網資源遏制住了人們對網絡資源的惡意抄襲。但檢測實踐中,發現報告單有大量的網絡資源時間上滯后于檢測論文,經過多篇測試此類列表的存在雖對結果的影響不大,但是容易造成作者對檢測系統失去信任。數據庫開發商應該針對網絡文獻類型從時間上加以限制彌補此類漏洞,在系統未完善的情況下檢測人員手工認真核查排除錯誤列表后再出具可信的報告單。 
       此外,檢測結果涵蓋參考文獻部分,檢測結果涵蓋文章本身,邏輯計算錯誤,同一論文不同時間檢測結果不同等不容忽視的個案造成的檢測結果偏差雖屬于偶然現象,也給人以警示。系統開發商應直面問題,給使用者以合理解釋,關鍵在于不斷完善系統,杜絕類似情況再次發生。專業檢測人員也要以嚴謹的態度對待每一篇論文的檢測,力求做到不冤枉、不誤判每一位作者的辛勤勞動成果。 
      4.3消除作者學術創作僥幸蒙混的念頭,以嚴謹的治學態度對待科學研究 
      除系統本身原因之外,大部分論文復制比偏高的原因來自于作者自身因素,主要體現形式為:(1)同一導師系列論文重復度高,作者認為在一個導師門下搞研究,方法、材料等都應該是相同的,論文出現相互雷同屬于正常現象。(2)同一主題系列論文重復度高,論文作者認為后期發表論文大量沿用自己以前發表的論文屬于正常現象。(3)同一作者同期發表的幾篇論文重復度高,一個時間段一個作者同時發表幾篇文章,出版時間較晚的論文檢測結果與較早出版的論文重復度很高。論文作者認為同一研究思路得出不同的結論合情合理。(4)同一主題系列論文重復度高,不同時間發表的同一主題論文重復率達到70%以上。顯而易見是一稿多投現象。只是論文題目做了適當改動。(5)作者不重視規范引用格式,不嚴格按照引用規范標準撰寫論文,要么不標注引用,要么引用格式不規范,要么參考文獻不列出來都是造成結果偏高的直接原因。比如:編輯部對同意錄用的稿件會做編輯校對工作,一方面潤色文字,一方面會根據版面要求做一些文字的刪減,刪減的文字一般是一些無關論文主要觀點的語句,作者引用的部分是論文的重要支撐絕對不會刪掉,還是要強調“引注”,規范寫作格式,可以規避造成的文字復制。 
       以上作者檢測論文出現檢測偏高結果,均為自身原因造成,第一種現象不成立的理由,應該是雖然同屬一個導師,教導方法一致,但是每個個體的行文方式、語言表達應該有所不同,出現相同情況,圖省事拿來別人的東西據為己有實屬抄襲、剽竊行為;第二到四種現象毋庸置疑,純屬僥幸投機心理,同一時間段在投的多篇稿件編輯部無法檢測出復制比,如果沒有職稱評審、科研立項等的再次審定,多篇論文都將在評審中起到作用。第五種現象在論文中使用自己(或自己作為作者之一)已發表文獻的內容,卻不加引注,是一種不規范的學術行為,作為晉升高級職務的老師應該具備這樣的學術素養,否則從這一點上就不符合晉升要求。 
      5結束語 
       
       知網查重系統智能化程度有限,存在不少檢測盲區,只能作為一種輔助工具[2]。實踐證明,影響結果真實性,造成通過率不理想的主要原因集中在知網查重系統存在的問題和作者行文主客觀因素這兩大方面。借助知網查重系統檢測學術論文客觀評價科研人員的學術水平杜絕使用裸數據,一定要融入圖書館信息檢測專業人員的判斷,采取審慎、科學、客觀的態度,對檢測系統多層面、深層次地理解與把握[3],力求檢測結果的科學性、客觀性、公正性。 


    知網查重入口