PaperPass與知網(wǎng)查重的使用心得

經(jīng)過畢業(yè)前期,畢業(yè)論文書寫成為我們?cè)谛4髮W(xué)生頭等大事,每天埋頭苦寫,唯恐重復(fù)率過高。知道昨天顯示論文查重通過才算是送了口氣。

現(xiàn)在流行的相似度匹配系統(tǒng)大概有這么幾類學(xué)術(shù)不端網(wǎng)、中國知網(wǎng)、paperpass、及微中國知網(wǎng)等。這些系統(tǒng)的原理都是一樣的,都是把你提交的論文拆分成一堆句子,再拆分成一堆關(guān)鍵字,然后與他們維護(hù)的數(shù)據(jù)庫做對(duì)比,計(jì)算重復(fù)的文字在你文章里的比重,算法類似于百度的關(guān)鍵字匹配,這么說,大家也就明白了,你簡單地把一個(gè)句子的各別詞換成同意詞,把字句變被字句,加一兩個(gè)“的”等是不行的,除非你把句子40%的詞都換了。

略有不同的他們數(shù)據(jù)庫內(nèi)文獻(xiàn)的多少、查重的粒度及斷定為相似的閥值。數(shù)據(jù)庫的大小就不說了,那后兩個(gè)是什么呢?查重的粒度指可以被認(rèn)定為重復(fù)句的最小句長,舉個(gè)例子,現(xiàn)在的系統(tǒng)都把分號(hào)與句號(hào)當(dāng)作分句符,paperpass把這個(gè)最小句長設(shè)為8,這意味著小于8個(gè)字的句子無論怎樣都不會(huì)被認(rèn)為是重復(fù)的,因?yàn)槟銢]有到人家檢測(cè)的門檻。中國知網(wǎng)的好像是13。相似的閥值指和原文相似多少以上為重復(fù),舉個(gè)例子,paperpass把你的文章中的文字分為三種綠色、橙色與紅色,分別表示該句與原文的重復(fù)度在40%以下、40%~60%、60%以上,除綠色以外其他部分都會(huì)被計(jì)算為相似度,而中國知網(wǎng)的閥值好像為60%,只會(huì)把你的文章中的句子分為兩類:重復(fù)與原創(chuàng)。同時(shí),還要說明一下,這個(gè)閥值有可能不是固定的,一般系統(tǒng)會(huì)設(shè)一個(gè)重點(diǎn)檢查的論文,比如說,你抄文獻(xiàn)A的比較多,中國知網(wǎng)查出你的文章與A的重復(fù)度在5%以上,系統(tǒng)就會(huì)重點(diǎn)查A,如果你這句子與A有50%的相似也可能會(huì)判為重復(fù)。

我所理解的查重系統(tǒng)的大概原理也就這些了。下面介紹下我們常用的系統(tǒng):中國知網(wǎng)與paperpass。中國知網(wǎng)是官方的系統(tǒng),大部分學(xué)校用的都是中國知網(wǎng),當(dāng)然我校也是;paperpass為一個(gè)公司開發(fā)的,因?yàn)椴僮鞣奖?、不太貴且非常嚴(yán)格,被我們廣泛使用,我個(gè)人只用過paperpass。因?yàn)?,只有校方的人有中國知網(wǎng)的入口,他們?cè)谔詫毶腺I,一次要300,而且經(jīng)常要改的話可能要檢數(shù)次,對(duì)學(xué)生是一筆很大的開銷。除此外,至于我為什么沒用中國知網(wǎng)查,還有個(gè)小故事,教研室和我一同改論文的一兄弟,paperpass改到了17%,用中國知網(wǎng)查了一個(gè)才0.7%,我這個(gè)18%也就非常放心了。

paperpass查一次是一萬字10元,我的正文純字?jǐn)?shù)3萬4,加標(biāo)點(diǎn)近4萬,檢一次40元。paperpass由于參數(shù)嚴(yán)格,所以結(jié)果會(huì)高于中國知網(wǎng)的,至于高多少這沒有準(zhǔn)。但使用paperpass時(shí)要注意的是,paperpass的數(shù)據(jù)庫并沒有中國知網(wǎng)全,他們自已也承認(rèn),他們只保證有中國知網(wǎng)90%以上的文獻(xiàn),那哪部分沒有呢?據(jù)我觀察是最新的沒有,paperpass是商業(yè)機(jī)構(gòu),他們沒有中國知網(wǎng)的數(shù)據(jù)庫,他們數(shù)據(jù)的來源可想而知---買個(gè)中國知網(wǎng)的號(hào),然后“扒”論文,類似于百度的人說我們的一大工作是“扒”網(wǎng)頁。所以最新的沒來的及入庫的,當(dāng)然也檢不到,不過還好的是,他有“自建庫”功能,如果你覺得你抄了某最新文獻(xiàn)B比較多了,但沒查出來,可以自已上傳。

同時(shí),因?yàn)閜aperpass有時(shí)過于嚴(yán)格,會(huì)出現(xiàn),你都已經(jīng)看不出改動(dòng)了,他還是橙色,比如我的18%、我兄弟的17%。這時(shí)就可以不改了,過尤不及,0.7也說不過去。

下面說下我的方法,這個(gè)網(wǎng)上都有,而且更全,我怕不過,但又不想在這上面費(fèi)更多的時(shí)間,就簡單地用了幾招:

1.盡量用長句,相當(dāng)于加大基數(shù)。

2.拼湊,不是把不同文獻(xiàn)的句子拼成一段,這樣沒用,而是把幾篇文章中的同一意思的幾個(gè)句子,拼成一句。

3.翻譯,翻譯國外的論文基本不會(huì)發(fā)生重復(fù),而且從道義上講也是合理的,翻譯也是自己的工作,是為學(xué)術(shù)做了貢獻(xiàn)的。畢竟,那些評(píng)你論文的教授們也沒打算讓你有什么開創(chuàng)性的成果,有自己的工作就可以了。

4.看一遍原文用自己的話去闡述,這也是個(gè)好辦法,起碼自己是完全懂了的。

個(gè)人結(jié)合大眾的建議是選擇后兩種,因?yàn)椴橹叵到y(tǒng)不是為查重而查重的,所作的根本還是希望大學(xué)生們還是發(fā)揮自己的能力做原創(chuàng)作品,設(shè)計(jì)的原則是“可以放過一個(gè)壞人,但決不錯(cuò)怪一個(gè)好人”,只要是自已寫的或是翻譯的,通過就是小意思了。再或者說,我們的論文查重系統(tǒng)是讓我們大學(xué)生都具備基本的科研能力,自己完成任務(wù)還是收益頗豐的。在我們的學(xué)位沒問題的情況下還是多多保持原創(chuàng)吧!

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 這篇文章好久不見,文字太多了,雖然當(dāng)時(shí)有感而發(fā),現(xiàn)在著實(shí)看不下去。剛才同門師弟問查重的事情,突然想起了這。 再三說...
    LL蘑菇頭閱讀 2,414評(píng)論 0 3
  • 【體驗(yàn)入】昨晚回流會(huì)議過程中,看到分店員工個(gè)個(gè)陽光積極,自己反省檢討。今天下午,準(zhǔn)備推進(jìn)《全員生發(fā)》的宣講,同事說...
    Alina_qi閱讀 135評(píng)論 0 1
  • 這片灰有多大 沒人知道 我膽小 不敢邁步 怕再被別人碰倒 站在原地就好 就好 這片灰有多大 有人知道 他們說 邁...
    陳年老九閱讀 181評(píng)論 0 3
  • 在我失戀,心如死灰的時(shí)候,是她陪在我的身邊,幫我布置起我小小但是充滿陽光的家,很溫暖的家;帶我去散心,是她陪著我在...
    評(píng)綜俠影閱讀 718評(píng)論 2 50

友情鏈接更多精彩內(nèi)容