內容簡介
「e考據乃以傳統專業知識與研究方法為根基,透過大數據工具的高效應用,致力於全面爬梳資料、深化考證。這種方法既是現代化的考據手段,也展現了一種積極融合數位技術與傳統學術的研究態度。」——黃一農
e考據以傳統專業知識與研究方法作為基石,再運用大數據的環境與工具,做為爬梳材料並深化考據的一個研究方法,亦可視為一種融通數位與傳統的研究態度。
海量數據、問題意識、知識地圖、搜尋技巧與經營模式之間的有機結合,乃e考據功力高下之所繫。黃一農院士於二十多年前即揭舉「e考據」時代的到臨,並在邊摸索、邊學習中,順利跨越幾個截然有別的文史領域,完成七本專著和百餘篇論文。《E考據與文史研究》不僅是作者迄今最重要的一本學術專書,也是其將自己的經驗和心得整理後,與文史研究者們分享,做為在面對大數據時代衝擊的重量級「武林秘笈」。
作者期望本書的出現,能在AI正以雷霆萬鈞之勢衝擊文科的當口,為大數據時代才可能橫空出世的e考據之法略作小結。同時希冀在大數據資源成倍數增長的今日,能有更多學者擁抱此方法,共同激發古老學問在數位時代的生機與動能。
作者介紹
黃一農為美國哥倫比亞大學天文博士,曾於Nature和Science等權威期刊發表過論文。1987年突然改行至新竹清華大學歷史所,又在2025年毅然脫離文史學界,現為該校唯一且最高位階的「清華終身特聘講座教授」,專任於跨院國際博士班學位學程。他先後挑戰科技史、中西文明交流史、明清史、術數史、軍事史、紅學、避諱學、數位人文等不同領域,2006年獲授教育部終身榮譽國家講座及中研院人文組院士桂冠,更曾獲得荷蘭萊頓大學首屆「胡適漢學訪問講座」、香港大學及香港理工大學榮譽教授、北京中科院名譽研究員、北京中國藝術研究院名譽高級研究員等榮銜。他期許自己能成為一位夢想家。
序
自序
筆者於1987 年自天文學轉行歷史學後,前有將近二十年的時間努力穿梭在海內外各圖書館,並浸淫於一落落的古籍當中,真心實意地積澱自己的傳統功力,2006年僥倖獲得中研院人文組的院士桂冠。然從1988 年我頻繁使用中研院開發的「漢籍全文資料庫」(坊間第一個大型的漢學資料庫)後,就日益感受到大數據(big data;指資料庫中或網路上所積累的巨量資料)對文科的衝擊,遂於2005年在拙著《兩頭蛇:明末清初的第一代天主教徒》中首揭「e考據」一詞。當2008年新竹清華大學購置愛如生的「中國基本古籍庫V1.0」後,體會日益深刻。隨著校內可用的古典文獻資料庫不斷增多,筆者的操作技巧亦因不斷磨礪而更加熟稔,這令我對資料庫已達到重度倚賴的程度,並因此常敢貿然從事跨界的新學術探險。
2014年暑假我在杭州浙江大學舉辦了為期一週的第二屆「e 考據研習營」,上海《文匯報》派了兩名記者參加。10月該報副刊《文匯學人》改版,首期專題就談「當乾嘉考據遇上互聯網」,並以多個版面採訪了我對e時代如何進行文史考據的看法。接下來,在撰寫《二重奏:紅學與清史的對話》(2014)、《紅樓夢外:曹雪芹《畫冊》與《廢藝齋集稿》新證》(2020)、《曹雪芹的家族印記》(2022)、《清代避諱研究:e 考據的學術實踐》(2024)等書的研析過程中,我深感此法在跨域時所帶來的能量與效力,但也或因此惹人眼紅,e 考據遂常遭池魚之殃。在學界部分有心人士的打壓或譏評之下,我只有回應以更多、更好的研究成果,且不斷嘗試探索學術世界的各種新機遇,並偶以三國魏•李康〈運命論〉「木秀于林,風必摧之……」的警句自嘲(附錄2.2)。
近年來包含資訊學門在內的跨領域學者,對大數據或數位人文(digital humanities;特指那些唯有藉助數位科技方能進行的人文研究)的討論可說是方興未艾。然因筆者先前未曾專文介紹或剖析e考據的研究方法,以致學界在各自的主觀認知下,正反評價互見。其實,真正的e考據應是在大數據的從旁輔助下從事考據(考據雖非所有文史研究的終極目的,但卻常是許多研究不可或缺的基礎),而絕非僅僅依靠數位資料進行關鍵字檢索!尤其,古籍數位化過程往往出現文字訛誤,版本的選擇也偶見未臻理想,故使用時仍須儘量回查原書,並做足甄別史料的功夫。又因材料不太可能全面數位化,傳統的資料蒐集方法在治學時亦不可偏廢。
至於史料的爬梳,尤其不該只停留在盲搜的層次,否則其結果往往龐雜無序且顧此失彼。而是必須透過敏銳的問題意識(problem awareness)與細膩的邏輯推理,就相關之人物、地點、時間、官銜或史事等,進行疊代(iterative) 且「竭澤而漁」式的檢索。亦即,從搜尋獲取的新知識或線索,常需再轉化成新的關鍵詞,並回到資料庫中繼續爬梳,期能深化研究結果,甚而創造出有力的證據鏈。此外,e 時代文史工作者的學術養成,非常需要有意識地在自己的腦海中建置一個解析度以及涵蓋面均日益翔實的「知識地圖(knowledgemap;泛指對知識的具體內容、呈現方式及其所在之處的掌握能力)」,並學習如何有效運用此虛擬地圖,以充分發揮e 考據時的導航工作,該能力應是新世代學者區隔彼此功力的關鍵之一。而使用海量數據所進行的盲搜,更應視為一種學習過程,以更新或改進自己的知識地圖。
質言之,e 考據是在傳統訓練所積累的專業知識與研究方法外,輔以對大數據的充分運用,以儘可能爬梳材料並深化考據的一種現代手段。它也可被視為一種傾力融通數位與傳統的研究態度,目的是在e 時代的環境與工具下,為文史學門創造更開闊的學術視野和更卓越的學術成果。
鑒於筆者有幸在近半世紀的學術生涯中,跨越文理以及文史的範疇,且身處文科研究環境有史以來最大的變局,而許多學界人士皆正各自摸索並揣摩該如何因應大數據的衝擊,筆者遂決意在學術生涯的最後幾哩路,將跨域學習的成長經驗撰成這本《E考據與文史研究》,希冀能與有興趣的學界朋友多些對話與切磋,並接受公允的批評與指正。同時,也謹將此書呈獻給50多年前我在新竹清華大學物理系求學時的兩位啟蒙恩師:李怡嚴(1937-2024) 教授和蔣亨進教授,感謝他們培養了我追求知識的興趣以及邏輯思辨的能力,更提供了我學習如何做人做事的榜樣。
回憶筆者於1973 年考進物理系時,怡嚴老師開設了必修的「基礎物理」課程,9 他上課皆使用自己編寫的講義,我們班上45個同學,從週一至週五每天上課1小時,另有2個晚上各2小時的演習課,則是由系主任亨進老師親自講授。同學們在這套持續了2年4個學期、總共36學分的課程改革中,都背負著兩位老師甚高的期許(培育出4人次的美國科學院院士、美國工程院院士、臺灣中研院院士,以及許多高科技產業的菁英)。但很慚愧,我在美國哥倫比亞大學(Columbia University) 物理系獲得博士學位,並於麻州大學(University ofMassachusetts, Amherst) 天文系完成博士後研究之後,就當了科學界逃兵。倒是自大學時代開始奠基的嚴謹邏輯訓練,與在太空總署(NASA) 研究時所培養的處理海量數據的分析能力,10讓在文科自學無師的我,僥倖找到一條可深入學術叢林秘境的幽徑,且於天文轉人文的過程中,快速感受並掌握到大數據的效力。
隨著近來各種資料庫的飛躍增長,目前已有近200億字清代以前的古典文獻可全文檢索,此與理想狀況雖仍有距離,但相較十多年前僅能依賴「漢籍全文資料庫」「中國基本古籍庫」的環境而言,早就不可同日而語。
由於現今的海量數據對許多議題的鑽研而言,往往比先前更具可操作性或統計意義,筆者遂選擇一些曾處理過且較具範式意義的個案,嘗試重作並深究,以探索e時代不斷進步的研究環境對文史學界所可能產生的新機遇,並儘量詳載研究時的操作或思維過程,期盼能與有興趣的朋友分享。
炒冷飯如果裹上蛋液並灑上翠綠青蔥和香郁白芝麻,其實亦有可能做出美食。尤其,現有的大量資料庫應可讓許多課題的學術論證更加完備與堅實,並以粒粒分明、彈牙可口且金黃酥香的特色,重新塑造冷飯新炒的創意。又因本書的撰寫旨在呈顯大數據時代文科所正面對的挑戰,而筆者屢感e考據常有機會大幅縮短學習曲線,遂決定走出先前熟悉的「舒適圈」,以「苦人所苦」的態度嘗試接觸新的領域。丙編〈讀書得「間」:從建築史到賦役史〉的3章,就是以筆者完全陌生的範疇為切入點,希望能展現e 考據之法的開創力與攻堅力。
在這段寫書過程當中,我所服務之新竹清華大學「科技考古與文物鑑定研究中心」(由我大學同班蔡能賢教授捐設)與「人文社會研究中心」的同仁,給予筆者不少支持。再者,我物理系學弟彭健雄博士,也慷慨捐贈一筆極可觀經費,在母校成立「中文古籍數位資源中心」,協助持續添置漢學相關資料庫。此外,北京大學中文系高樹偉博士、廣州大學歷史系郭永欽副教授、北京中國政法大學法律古籍整理研究所李雪梅教授、臺北政治大學資訊科學系劉昭麟教授、新竹清華大學經濟系賴建誠教授和歷史所吳國聖老師、寧波大學龔纓晏教授、中國科學院自然科學史所鄭誠研究員、小友趙帥軍同學以及「日安堂」銀兩收藏家吳宗喆先生,亦提供不少意見或幫忙,謹此誌謝。最後,要特別感謝回查文獻並校改文本的孫韻潔以及修圖排版並造字的高淑悅兩位女史。
回想自2020年新冠疫情熾烈以來,我邀集了40 幾位新竹清華文科各領域老師一起投入「疫起•閉關•寫書」的計畫,很高興此書是我繳交的第5本專書。尤其,它們過半是我決定不再向公部門丐求經費補助後,以「學術自由人」身分所完成的新研究成果。本書得以在動念一年多內即付梓,進度遠超乎預期,當然部分可歸因於每天筆耕常超過8小時,但亦凸顯出我所高度倚賴之大數據環境與e 考據方法的強大威力。
此書所處理的議題,相信多符合相關領域的高標,但一些細節則不可能皆止於至善,尤其,多面向的海量數據已令現今學界不易再出現掌握材料的絕對權威。故若此書的研究有所不足或論據失誤,請歸咎於筆者的學力或努力不夠,e考據不該成為替罪羔羊。野人獻曝,知我罪我,其聽之!
乙巳秋成稿於耕讀所在的苗栗南庄二寄軒
目次
甲編 e考據的昔與今
第一章 韓霖《鐸書》闕名序作者小考
一、前言
二、如何爬梳《鐸書》闕名序的作者
三、李建泰之名為何遭挖削
四、餘論
乙編 語義學中的用典
第二章 論古代詩文僻典的掌握
一、治中外交流史時的「蜍志」用典
二、治紅學時的「呂袋」用典
三、小結
第三章 論古代詩文熟典的借喻
一、曹寅詩為何稱弟曹荃為「卯君」?
二、曹家捐監咨文內容的可信度
三、餘論
丙編 建築史、賦役史中的計量單位
第四章 古代建築用語中的「間」
一、從曹雪芹家在京所住的蒜市口十七間半談起
二、中國古建以「間」計數的傳統
三、中國古建如何定義「半間」之數?
四、小結
第五章 校勘學視角下的「E文獻學」
一、《京兆府學贍學舍地清冊》PDF誤檔的發現
二、《京兆府學贍學舍地清冊》內容考釋
三、各漢籍全文資料庫的文字正確率
四、餘論
第六章 明清賦役單位「稅間」與「稅丁」
一、「稅間」:古代租稅資料中的畸零「間」數
二、論丁口數並未使用白銀的計量單位
三、論丁口尾數所用「斗、升、合」非容積單位
四、從《休寧黃氏鬮書底冊》試探稅丁的析分
五、小結
丁編 古典文本中的名物
第七章 《紅樓夢》秤量敘述中的星戥
一、前言
二、《紅樓夢》中所描述各種品名的香
三、寶玉荷包中所攜帶「兩星沉速」的意涵
四、戥子與麝月所謂「那是一兩的星兒?」
五、小結
第八章 《紅樓夢》的醫藥知識vs文學虛構
一、前言
二、藥中最貴重的牛黃
三、曹雪芹的人參知識
四、寶玉所提及的珍貴藥方「暖香丸」
五、舶來的「依弗哪」與「汪恰洋煙」
六、小結
戊編 海量歷史語境下的避諱學
第九章 從康熙刻本中的缺筆「胤」字談起
一、雍正帝即位前刻本中「胤」字的寫法
二、康熙朝曾否敬避皇太子胤礽之名?
三、小結
己編 結論
第十章 e考據與文史研究的新機遇
參考文獻