【理響中國】AI如何解密甲骨文
甲骨文作為中華民族寶貴的精神財(cái)富,不僅承載著深厚的文化底蘊(yùn),還蘊(yùn)含著豐富的學(xué)術(shù)和史料價(jià)值。這一古老的文字,猶如穿越時(shí)空的信使,傳遞著先人的智慧與文明的信息。
作為我國已知最早的成熟文字系統(tǒng),甲骨文自1899年首次被發(fā)現(xiàn)以來,便引起了學(xué)術(shù)界的廣泛關(guān)注。歷經(jīng)數(shù)代學(xué)者的不懈努力,甲骨文研究取得了豐碩的成果,為我們揭示了古代社會(huì)的諸多秘密。然而,甲骨文研究的專業(yè)性極強(qiáng),加之甲骨本身易損且分散保存于各地,使得這一領(lǐng)域的研究仍面臨諸多挑戰(zhàn)。
近年來,隨著人工智能技術(shù)的飛速進(jìn)步,人們開始探索將AI應(yīng)用于甲骨文研究的新途徑。這一創(chuàng)新性的嘗試不僅為甲骨文研究注入了新的活力,也引發(fā)了學(xué)界的廣泛討論和期待。在數(shù)字化和智能化的浪潮中,甲骨文研究究竟取得了哪些實(shí)質(zhì)性的進(jìn)展?人工智能能否憑借其強(qiáng)大的計(jì)算能力,成功破解甲骨文的千古之謎?其背后的核心優(yōu)勢又是什么?為深入了解這些問題,記者采訪了中國社會(huì)科學(xué)院學(xué)部委員、甲骨學(xué)家宋鎮(zhèn)豪,請他帶我們走進(jìn)“數(shù)字化時(shí)代”的甲骨文。
創(chuàng)新:用高質(zhì)量數(shù)據(jù)庫投喂AI
歷經(jīng)三千余載歲月洗禮的甲骨文,無時(shí)無刻不在與風(fēng)化、蟲蠹、破壞等自然力量抗?fàn)?。在以往的甲骨文研究中,學(xué)者們主要依賴于拓片研究與書面著錄。然而,這一傳統(tǒng)方式往往受限于甲骨文字的模糊和信息的碎片化,難以形成統(tǒng)一且全面的認(rèn)知。如今,隨著數(shù)字技術(shù)的飛躍式發(fā)展,我們擁有了前所未有的工具——上億像素的相機(jī)、微距拍攝技術(shù)、三維建模、紅外線拍攝以及多光譜拍攝等。這些高科技手段共同織就了一張細(xì)密的網(wǎng),全方位、多角度地捕捉并呈現(xiàn)了甲骨的真實(shí)面貌。尤為值得一提的是,微痕增強(qiáng)技術(shù)的引入更為甲骨文的解析工作開辟了新天地。即便是在肉眼難以辨識(shí)的細(xì)微之處,這項(xiàng)技術(shù)也能讓研究者清晰地看到甲骨上那些淺淺的刻痕,進(jìn)而更為精準(zhǔn)地分析筆畫走向與字形輪廓。此外,光譜分析技術(shù)的運(yùn)用,使我們得以窺見那些被丹砂“涂朱”或被炭黑“填墨”的甲骨文背后所隱藏的特殊含義,為解開古老文明的密碼提供了寶貴的線索。
經(jīng)過長達(dá)125年的不懈努力,甲骨文研究已從最初的辨析階段邁上了認(rèn)知發(fā)展的新臺(tái)階。宋鎮(zhèn)豪指出,盡管目前甲骨文已知的單字?jǐn)?shù)量已逾4200個(gè),但能夠確切釋讀的卻僅占總數(shù)的1/3左右。這意味著,仍有大量的甲骨文字等待著我們?nèi)ザ?、去解讀。同時(shí),他也強(qiáng)調(diào),甲骨文研究不應(yīng)局限于單個(gè)文字的識(shí)別,而應(yīng)更加注重其中所蘊(yùn)含的人文精神與思想內(nèi)涵。宋鎮(zhèn)豪表示,甲骨文作為殷商時(shí)期的重要文化遺產(chǎn),不僅記錄了祭祀、戰(zhàn)爭、占卜、記事等日?;顒?dòng),還生動(dòng)再現(xiàn)了當(dāng)時(shí)社會(huì)的經(jīng)濟(jì)、政治、文化等各個(gè)方面。它如同一部生動(dòng)的歷史畫卷,為我們揭開了古老殷商王朝的神秘面紗。如今,借助人工智能與大數(shù)據(jù)的力量,我們可以對(duì)這些珍貴的史料進(jìn)行深度挖掘與關(guān)聯(lián)分析,從而更加全面、深入地理解那段遙遠(yuǎn)而輝煌的歷史。
對(duì)于人工智能在甲骨文研究中的應(yīng)用前景,宋鎮(zhèn)豪充滿了期待。他認(rèn)為,學(xué)習(xí)型人工智能的關(guān)鍵在于為其提供充足且高質(zhì)量的“教材”。在這些“教材”的滋養(yǎng)下,人工智能將承擔(dān)更多的研究任務(wù),如甲骨文字形識(shí)別、拓影甲骨字的提取與檢測、甲骨文的組類區(qū)分、甲骨片的查重收斂、甲骨片的智能綴合以及甲骨文例的釋讀解析等。譬如在甲骨綴合領(lǐng)域,人工智能技術(shù)展現(xiàn)出了巨大的潛力。面對(duì)那些因年代久遠(yuǎn)而破碎不堪的甲骨碎片,人工智能能夠憑借其強(qiáng)大的數(shù)據(jù)處理能力與算法優(yōu)勢,實(shí)現(xiàn)碎片的自動(dòng)綴合與拼接。這不僅極大地減輕了研究者的工作負(fù)擔(dān),更為甲骨文的完整復(fù)原與深入研究提供了有力支持。此外,人工智能還能夠在研究成果的集成與校驗(yàn)方面發(fā)揮重要作用。通過對(duì)已有研究成果的重新審視與校驗(yàn),人工智能能夠及時(shí)發(fā)現(xiàn)并糾正其中的錯(cuò)誤與遺漏,確保甲骨文研究的準(zhǔn)確性與可靠性。
突破:甲骨文大數(shù)據(jù)平臺(tái)不斷完善
2019年,值甲骨文發(fā)現(xiàn)120周年之際,中國社會(huì)科學(xué)院甲骨學(xué)殷商史研究中心與安陽師范學(xué)院教育部暨河南省甲骨文信息處理重點(diǎn)實(shí)驗(yàn)室攜手共創(chuàng)的甲骨文大數(shù)據(jù)平臺(tái)——“殷契文淵”(http://jgw.aynu.edu.cn/)向全球免費(fèi)開放。
登錄“殷契文淵”官方網(wǎng)站,一幅幅古樸典雅的甲骨文與深邃的暗黑背景交相輝映,營造出一種穿越時(shí)空的神秘氛圍,同時(shí)又不失現(xiàn)代科技的未來感。該平臺(tái)集成了甲骨著錄庫、甲骨字形庫、甲骨文獻(xiàn)庫以及甲骨文知識(shí)服務(wù)平臺(tái)等多個(gè)功能模塊,為用戶提供了全方位、多層次的甲骨文信息查詢與研究體驗(yàn)。
截至目前,“殷契文淵”已收錄甲骨著錄多達(dá)154種,甲骨圖像更是達(dá)到了驚人的239902幅,甲骨論著亦有34418種之豐。記者嘗試在字形庫中輸入“文”字,便迅速檢索到與之相關(guān)的甲骨單字詳情,進(jìn)而通過片號(hào)查詢包含該字形的甲骨片及其釋讀信息,真切體會(huì)到這一大數(shù)據(jù)平臺(tái)給學(xué)者與甲骨愛好者的研究工作帶來的極大便利。
“‘殷契文淵’已步入第五期建設(shè)新階段,并建設(shè)了‘殷契文淵AI協(xié)同研究平臺(tái)’?!彼捂?zhèn)豪表示,未來,該平臺(tái)將致力于全球范圍內(nèi)甲骨文大數(shù)據(jù)的精細(xì)采集,并在AI大模型的輔助下實(shí)現(xiàn)智能化深度集散與知識(shí)體系的育成,為甲骨文研究開辟更加廣闊的空間。
回顧歷史,20世紀(jì)在郭沫若、胡厚宣等學(xué)術(shù)巨擘的引領(lǐng)下,《甲骨文合集》歷經(jīng)二十六載春秋,精選傳世甲骨41956片,編撰成書,成為甲骨學(xué)領(lǐng)域的扛鼎之作。隨后,《甲骨文合集補(bǔ)編》又增補(bǔ)了13450片甲骨,進(jìn)一步豐富了甲骨文的資料庫。然而,據(jù)統(tǒng)計(jì),目前全球范圍內(nèi)已知的甲骨數(shù)量已逾16萬片,仍有大量珍貴甲骨散落各處,甚至沉睡于庫房之中,亟待發(fā)掘與整理。宋鎮(zhèn)豪說,依靠我們目前手中有限的甲骨文資料,想要揭開中國古史的奧秘,還遠(yuǎn)遠(yuǎn)不夠。
除了甲骨全面整理著錄這一制約性問題,甲骨釋讀的難度更大。甲骨文等古文字的考釋工作,恰似一個(gè)錯(cuò)綜復(fù)雜的解謎與破案過程,要求研究者們在浩瀚的已知信息中抽絲剝繭,尋找關(guān)鍵證據(jù),以推求未知的真相。這一過程不僅考驗(yàn)著研究者的專業(yè)知識(shí)與技能,更對(duì)其跨學(xué)科的綜合素養(yǎng)提出了很高的要求。甲骨文研究領(lǐng)域的知識(shí)門檻相對(duì)較高,需要研究者精通古文字學(xué),并具備歷史、考古、天文、地理、文獻(xiàn)、語法等多方面的知識(shí)儲(chǔ)備。
面對(duì)這一挑戰(zhàn),我國政府相關(guān)部門積極作為,推動(dòng)全國多所高校研究團(tuán)隊(duì)投身于人工智能輔助甲骨文研究的探索之中。在互聯(lián)網(wǎng)科技公司的鼎力支持下,甲骨文數(shù)據(jù)集得以不斷完善與擴(kuò)充,為AI技術(shù)的深度應(yīng)用提供了堅(jiān)實(shí)基礎(chǔ)。“我始終堅(jiān)信,建立高質(zhì)量的甲骨文數(shù)據(jù)庫才是長遠(yuǎn)之計(jì)?!彼捂?zhèn)豪強(qiáng)調(diào),我們亟須通過第一手資料的匯總與整理,構(gòu)建一個(gè)權(quán)威、核心且可持續(xù)發(fā)展的平臺(tái)。我們在此基礎(chǔ)上進(jìn)行科學(xué)分析與研究,以期解決一些重大問題,推動(dòng)對(duì)中華文明歷史進(jìn)程的深入了解與闡釋。
心愿:讓數(shù)字化助力甲骨文“回家”
近日,散落在韓國的7片甲骨實(shí)物高保真數(shù)據(jù)首次以數(shù)字化形式“回歸”安陽。這標(biāo)志著甲骨文正式開啟了數(shù)字化“歸鄉(xiāng)”之路。
一片甲骨驚天下。甲骨文以其獨(dú)特的魅力展現(xiàn)了中華民族的偉大智慧和創(chuàng)造。安陽殷墟是甲骨文的主要出土地,安陽小屯出土的近16萬片甲骨文物分散收藏于全球近200家機(jī)構(gòu)中。宋鎮(zhèn)豪一直有一個(gè)心愿:讓甲骨文“回家”。然而,甲骨文以“物理形式”回歸殷墟幾無可能,隨著互聯(lián)網(wǎng)平臺(tái)的發(fā)展,數(shù)字化回歸成為最佳選擇。
以宋鎮(zhèn)豪為牽頭人,騰訊公司、中國先秦史學(xué)會(huì)、安陽師范學(xué)院等機(jī)構(gòu)發(fā)起的“全球甲骨數(shù)字回歸計(jì)劃”,以“殷契文淵”為基盤,逐步形成了甲骨采集、建模、存儲(chǔ)、展示、共享的標(biāo)準(zhǔn)規(guī)范和數(shù)字工具箱,初步實(shí)現(xiàn)了甲骨文數(shù)字化工程的試點(diǎn)建模。據(jù)了解,這項(xiàng)工程最大程度地保存了甲骨及其承載文字的原始面貌,有助于實(shí)現(xiàn)永續(xù)保存、傳播與傳承的目標(biāo)。以三維建模、微痕增強(qiáng)、人工智能等技術(shù)為基礎(chǔ)的“甲骨文全信息模型”突破了傳統(tǒng)研究對(duì)拓片、摹本、照片的依賴,不僅能看清甲骨文字,還能看到筆畫疊壓、朱書墨書、涂改刮削等其他原來看不清的相關(guān)信息,為甲骨文研究,特別是查重及綴合研究帶來了革命性變革,有力推動(dòng)了甲骨文以數(shù)字化形式回歸殷墟。團(tuán)隊(duì)還與加拿大英屬哥倫比亞大學(xué)、美國芝加哥大學(xué)、英國杜倫大學(xué)等知名高校及研究機(jī)構(gòu)初步達(dá)成合作意向,共同推動(dòng)此項(xiàng)工程的順利進(jìn)行。
宋鎮(zhèn)豪表示,甲骨文數(shù)字技術(shù)的突破形成了新質(zhì)生產(chǎn)力,計(jì)算機(jī)的學(xué)習(xí)功能遠(yuǎn)遠(yuǎn)高于人類。下一步,應(yīng)在整體整理材料的基礎(chǔ)上,通過文獻(xiàn)的碎片化標(biāo)注,全面增強(qiáng)大模型的甲骨學(xué)知識(shí)和能力。要不斷創(chuàng)新,加大人工智能與甲骨文復(fù)合型人才的培養(yǎng),使人工智能工具助力甲骨文相關(guān)各類工作提質(zhì)增效。
宋鎮(zhèn)豪談到,人工智能為甲骨文開發(fā)了更廣闊的天地和更多的應(yīng)用場景,讓甲骨文能夠得到永續(xù)保存與傳承。他堅(jiān)信,未來,隨著大數(shù)據(jù)、云平臺(tái)、人工智能等新技術(shù)在甲骨文研究領(lǐng)域的推廣和應(yīng)用,有望加快甲骨文探析進(jìn)程,解決長期困擾學(xué)界的疑難問題,甲骨文研究必將取得令人震撼的成果。(作者:段丹潔 來源:中國社會(huì)科學(xué)網(wǎng)-中國社會(huì)科學(xué)報(bào))
理論新聞精選:
- 2024年11月07日 12:21:40
- 2024年11月05日 16:07:39
- 2024年11月05日 11:57:35
- 2024年11月04日 10:53:49
- 2024年11月04日 10:44:23
- 2024年11月03日 13:50:36
- 2024年10月31日 21:45:29
- 2024年10月31日 15:46:09
- 2024年10月31日 15:46:01
- 2024年10月31日 15:45:53