2026年3月30日,一項面向高校本科生的歷史學術競賽正式啟動論文。與常規歷史學論文比賽不同,這場名為“我用AI寫歷史”的學術論文競賽,明確要求“使用指定的大語言模型(LLM)完成歷史學論文寫作,並提交全過程材料”,鼓勵參賽者“充分地、大膽地使用人工智慧進行歷史論文寫作”。
這項比賽由南京大學數字史學研究中心主辦,清華大學日新書院、中國社會科學院大學數字史學研究中心、復旦大學歷史學系、上海交通大學人文學院歷史資料中心、浙江大學歷史學院數智史學交叉實驗室、陝西師範大學歷史文化學院等多家單位協辦,試圖在高校和期刊對AI使用普遍持謹慎態度的背景下,走出一條不同的道路論文。
“在‘平行宇宙’中暴露問題”
賽事的組織者、南京大學歷史學院教授王濤告訴澎湃新聞(論文。我們發起一個‘鼓勵充分使用’人工智慧的寫作競賽,企圖展現一個學術研究的‘平行宇宙’,讓問題充分暴露,從而讓學界同行意識到真的已經到了需要提出應對方案的地步。”
競賽的徵稿啟示這樣解釋這場比賽的緣起:“人工智慧浪潮正迅速衝擊歷史學的研究、寫作與發表論文。與此同時,不少高校與學術期刊陸續釋出AI使用守則,使得AI在學術實踐中常被‘低調處理’‘隱形使用’,從而造成研究過程不可追溯、方法不可討論、倫理難以更新。”王濤認為,目前主流學術期刊的AI使用規範,其實是對作者良心的考量:“完全有可能出現這種情況:作者充分使用了AI,但是機器檢測不出來,人類評審專家也看不出來。而作者就是不承認用了AI。那麼,這樣的規範就是遮羞布。我們不需要反思為什麼AI使用規範不能被遵守,而應該反思為什麼作者會對使用AI的真實情況撒謊。是作者羞於提及AI,還是覺得無所謂,還是其他原因?我們希望透過競賽,創造一種作者不以使用AI為恥的環境,然後再去考慮哪些規範已經落後了。”
本次競賽設定三大目標:探索人機協作的邊界,評估AI的可能性與侷限性,推動方法與倫理更新論文。主辦方認為,與其迴避,不如擁抱;與其限制,不如探索。在明確規則與公開披露的前提下,讓人工智慧從“隱形使用者”走向“臺前協作者”,使其參與過程變得可追溯、可討論、可評估。
王濤表示,目前大家在談論人工智慧的賦能或者侷限性的時候,往往缺乏具體的案例,競賽則可以提供活生生的案例,既可以引起大家對人機協同歷史書寫的具體問題的討論,比如界定“輔助”和“代寫”,署名權的問題,也可以引申出學術研究的意義這樣的宏大議題,這就是徵稿啟示中強調的“以實踐反推倫理”論文。
“我們在教學中,已經遇到了學生用人工智慧提交作業,甚至讓人工智慧撰寫會議論文並被會議收錄的情況論文。學生們已經在大膽使用人工智慧了,我們卻還在用傳統的眼光看待他們。”王濤說。本次比賽的參賽物件限定為大二至大四年級的中國境內外高校在讀本科生。“我們希望歷史專業的學生掌握一些基本的學術能力以後再來參加比賽,因此規定大二以上可以參賽。”與此同時,比賽也鼓勵考古學、文博、區域國別、哲學、政治學等相關專業學生參與,但明確要求論文需符合歷史學基本訓練與規範。
三條賽道和兩場專題培訓
比賽由南京大學數智文獻實驗室提供內容支援,參賽選手報名後自動註冊為南京大學數智文獻處理平臺使用者,可在三種方式中任選其一進行創作,也可綜合運用論文。第一種方式為指定文獻命題創作,即在主辦方統一指定的文獻範圍內,利用數智文獻處理平臺進行史料長編整理、智慧分析,最終形成一篇完整的學術論文。第二種為自選文獻自由創作,選手可自行上傳個人收藏或公開獲取的歷史文獻至平臺,藉助平臺的分析工具進行研究。第三種是多工具融合創作,在利用平臺完成文字處理的基礎上,結合其他AI工具如地理資訊系統GIS等進行跨維度分析,形成具有多學科特色的論文。寫作週期為期20天。
展開全文
為使參賽選手熟悉平臺操作及大模型應用,主辦方將在賽前組織兩場專題培訓,分別是大語言模型API應用培訓和平臺操作培訓論文。前者內容涵蓋基本原理、API呼叫方法、提示詞設計技巧以及在歷史寫作中的典型應用案例,後者重點培訓文獻識別、翻譯、語義檢索、史料長編自動生成等核心功能。
競賽對透明披露的要求體現在多個層面論文。在模型使用方面,比賽預設呼叫指定模型。如選手在創作過程中自行使用其他大語言模型進行輔助,須在提交作品時附上詳細說明,包括所使用模型的名稱、版本、使用方式及具體用途。在過程記錄方面,數智文獻處理平臺將自動記錄選手在比賽期間的操作軌跡,包括文獻處理、檢索、分析等流程。這些記錄將作為評分的重要參考依據,使得AI參與歷史寫作的全過程變得可追溯、可復現。
“指定大模型是為了讓工具的差異性可以忽略,只關注學生個體的能力素養論文。同時,我們也限定在數智文獻平臺上進行,主要是為了讓學生們認識到,對歷史文獻的使用之於歷史研究的重要性。”王濤說。
人機協同的評審與倫理
本次比賽的評審機制採用“人機協同”的模式,由AI評分與專家評分共同決定最終成績論文。
AI打分時,首先制定多維評分標準,包括史料運用的準確性、邏輯結構的嚴謹性、分析深度、創新性等論文。由大語言模型對參賽作品進行多次獨立打分,去掉最高分與最低分後,取剩餘分數的平均值作為該模型的評分。隨後選用多個不同的大語言模型分別執行上述操作,得到各模型的評分,再將這些模型的評分去掉最高分與最低分後取平均,得到最終的AI評分。
人類專家評審則邀請歷史學領域的專家學者組成評審委員會,從學術價值、問題意識、論證過程等角度進行專業評審論文。綜合成績由AI評分與專家評分按一定權重加權計算得出。
在學術倫理方面,徵稿啟事中的責任宣告指出:本競賽鼓勵充分使用AI,但要求全過程透明披露論文。參賽作者對論文內容承擔全部學術責任,包括事實準確性、引用規範與觀點表達。嚴禁偽造史料、捏造引文或虛構參考文獻,一經發現取消資格。同時,組委會鼓勵參賽者把“AI可能出錯”作為研究物件之一,記錄錯誤、解釋原因、提出應對策略。
競賽鼓勵“充分使用”,但是否存在“上限”?假設一篇論文的80%由AI生成,學生僅做修改和整合,這樣的作品是否符合競賽精神?王濤表示,比賽中不做限制論文。“一方面實際操作中很難用百分比來設定上限,另一方面我們是希望讓學生意識到,寫作本來是自我表達的手段,如果他認為可以用一個人工智慧完成的作品代替自己的思路,或者願意提交一個不經過人工稽覈的作品代表自己的思考,那就是在放棄自己的主動性。這樣的作品進入競賽環節,也許評審無法識別出來,但作者就是在用這樣的行為創造一種新的學術生態。他們將是未來學術生態的創立者,他們的態度將是未來學術倫理的核心,他們願意在什麼樣的環境下思考問題、研究歷史,這種不加限制的人工智慧使用場景就是具體行為的開始。”
除一二三等獎外,比賽還特別設定“最具爭議獎”頒發給人類評審與AI評審分差最大的作品論文。“評分的差異很難預測。但我們的目的是讓人類專家也有機會見識‘學術論文’成果形態的多樣性。”王濤說。他表示,這場人機協作的史學實驗,試圖在真實的寫作過程中,重新審視並更新數字時代的學術倫理,讓人工智慧從“低調處理”的陰影中走出,在公開透明的框架下接受檢驗、討論與評估,“讓規範在真實寫作中被檢驗、被修訂,而不是停留在抽象禁令”。
3月30日由南京大學歷史學院釋出的比賽徵稿啟示