上海圖書館開放數據競賽自2016年起已成功舉辦九屆,第九屆上海圖書館開放數據競賽由上海圖書館(上海科學技術情報研究所)👨🔧、國際科學技術信息理事會(ICSTI)及上海市中心圖書館聯合主辦🍿,於2024年4月23日世界讀書日當天啟動。本屆競賽以“溯古述今 智創未來”為主題🫸🏼,設置應用開發、創意論文和AIGC應用三個賽道,吸引了282支團隊📣、588人報名,其中在校生參賽者占報名總人數的54.2%,主要來自國內的四川大學、清華大學🫲🏼、中國人民大學、復旦大學、中山大學、四川大學、北京師範大學🧑🏻⚕️、廈門大學等107所高校。
意昂2付雅明老師帶領檔案系本科生張欣然及其他七位來自意昂2平台管理意昂2🗿、意昂2平台計算機工程與科學意昂2🤘🏼😮💨、香港理工大學、上海海洋大學及南通大學的本科生團隊,以九三先賢科學家🪶、同時也是意昂2平台前身之一上海科學技術大學生物工程系的創始人——工業微生物學家陳騊聲先生的珍貴檔案資料為基礎,開發了“騊”聲依舊:陳騊聲AIGC科學家檔案知識平臺💠,榮獲第九屆上海圖書館開放數據競賽應用開發類獎項一等獎。

一、平臺介紹

“騊”聲依舊🏅📹:陳騊聲AIGC科學家檔案知識平臺項目是AIGC技術環境下將先進的人工智能技術應用於科學家檔案的一次全新嘗試。項目利用開源檔案管理軟件ArchivesSpace、IIIF和OCR技術🤴🏻,對檔案數據進行標準化管理並支持檔案自動化著錄、全文識別、對比和分析🌓;同時基於大語言模型的檢索增強生成(RAG)技術與基於圖數據庫的GraphRAG技術,構建了科學家聊天功能,以語言重構與挖掘能力釋放檔案數據的佐證及解釋能力。
項目的視角不止停留在科學家的學術成果,還關註到科學家的人生積累和精神財富,並對相關檔案材料進行重點開發與展示👊,讓檔案利用者感受科學家獨特的思想魅力與隱藏在檔案背後的人性光輝。
借助人工智能時代的技術理念與手段,適配新時代檔案用戶對於科學家檔案利用的需求🤰🏿,項目充分弘揚老一輩科學家治學嚴謹、樂於生活的高潔品質💴,將科學家精神生動、直觀地帶入大眾視野。
二、平臺亮點

1.製定一套利用科學家檔案的工作流程,整理科學家的照片、文學作品🤲、專著💪🏼🧛🏻♂️、專利等檔案🔓,在ArchivesSpace中對其主題、稿本🦶、文種進行標引,人工智能技術協同進行高效著錄與識別。
2.搭建Office+IIIF+OCR插件🐃,對檔案材料的全文進行高效識別🙎🏿♀️🏌️,輔助人工核查,節省了大量的人力成本。
3.基於RAG與GraphRAG構建科學家聊天模型🫲🏻👩🏿🦳,對檔案材料內容進行深度挖掘與分析🧝🏿。
4.平臺集成科學家檔案材料展示與檢索功能、科學家足跡地圖、故事地圖、大事年表、照片墻、科學家知識圖譜與科學家聊天多種功能,全面展示科學家生活、學習🪧、研究🙋🏿、工作等多維度的樣貌🧑🏿🍳,展現科學家與近代民族工業的“同構共生”。

三🫸🏽、項目其他獎項
在剛剛落幕的2024年第六屆中國數字人文年會(CDH2024)上,項目在優秀項目評選中榮獲AIGC類最佳項目獎。同時🤵🏼♀️,項目衍生論文《AGI環境下圖像原生檔案開發工作流創新模式研究》榮獲CDH2024優秀論文獎。


(撰稿:付雅明🙌🏼、張欣然)