科學技術發(fā)展是人工一把雙刃劍。作為時代的智能準辨產物,人工智能的對科的算出現(xiàn)推動社會發(fā)展進入一個全新階段,另一方面,研誠人工智能技術的信提學習濫用或非誠信使用,又會給社會造成很多負面影響。出新其中,挑戰(zhàn)以AIGC為代表的文察人工智能技術在科研領域的濫用,就會抑制真正的基于科研創(chuàng)新。
AIGC技術可以通過排列組織預訓練數(shù)據(jù)生成文本、深度圖像、法精數(shù)據(jù)、人工代碼、智能準辨視頻等,對科的算這些內容可能會形成論文或項目申請書,研誠存在觀點剽竊等隱患,也極易引發(fā)新形式的論文代寫、抄襲剽竊、洗稿等學術不端行為。根據(jù)Retraction Watch的數(shù)據(jù)統(tǒng)計,自2021年截止到2023年7月6日共有914篇因“Randomly Generated Content(隨機生成的內容)”原因被撤稿,約占近三年來撤稿論文總數(shù)的8.34%。
由于當下的AIGC技術生成內容無法明確知識來源,加上更加隱蔽的虛假數(shù)據(jù)“成果”,洗稿、新形式的論文代寫等學術不端行為,原有的相似度查重和圖像識別等技術逐漸失效,加大了識別這些學術不端行為的難度,對科研誠信提出了新的挑戰(zhàn)。
基于當前新時代下論文學術不端的治理需求,萬方數(shù)據(jù)推出科技論文誠信風險綜合察驗服務——萬方文察。該工具基于萬方數(shù)據(jù)文本檢測、圖像檢測等核心技術及科研誠信大數(shù)據(jù)資源基礎,實現(xiàn)對論文的文本相似性、圖像復用、AIGC文本、引文及作者等多要素的失信風險一站式綜合察驗,為教育、科研、出版、管理等誠信監(jiān)管工作提供便捷服務支撐。
萬方文察服務采用多項關鍵技術為技術支撐,基于海量科技文獻全文比對資源、科研誠信風險大數(shù)據(jù)資源、學術文獻圖像比對庫等資源為大數(shù)據(jù)底座,可支持在線云服務及API接口服務等服務形式,實現(xiàn)“一次提交、多維檢測”的一站式論文風險察驗服務。
在AIGC文本檢測方面,萬方文察服務采用基于深度學習的AIGC識別算法,基于卷積神經(jīng)網(wǎng)絡的強大表達能力,智能感知生成和非生成文本之間的差異,可識別目前較為通用的AI寫作模型,包括不限于ChatGPT、文心一言、GTP3.5、谷歌Bard、通義千問、必應ChatGpt、ChatSonic和其他AI寫作助手生成的中文文本。
除此之外,萬方文察服務還可提供論文圖像檢測、文本相似性檢測以及參考文獻、作者、基金資助等論文屬性風險檢測。
人工智能時代,學術不端更具隱蔽性,形式也多種多樣,給風險察驗帶來了很大的挑戰(zhàn)。萬方文察“以科技打敗科技”,讓論文中的AIGC文本無處遁形,全方面推動科研誠信建設。