電子佛典發展概況 

杜正民 

中央研究院計算中心通訊
第15期第13卷 (1999.06.21)
頁114-116


編按:近年來,佛典電子化逐漸在國際間受到重視與肯定,在本著推動佛典暨分享理念,除了吸引愈來愈多的單位及人力參與資料庫的建立外,並陸續公開各項成果於網上,蔚為網際網路另一股清新的風潮!隨著網際網路人口的不斷增加,「上網」這一個動作,在未來,對更多的人而言,將帶來更多面性的意義與內涵。 

緣起 
 ̄ ̄ 
  中央研究院計算中心與教育部電算中心於1999年1月15日至21日,假中央研究院學術活動中心與地球科學研究所會議廳主辦「1999EBTI, ECAI, SEERS暨PNC聯合會議」(註一)。其主題有圖書館資訊交流(Library Information Sharing)、網際網路之策略、地理資訊系統、數位典藏/博物館(Digital Library/Museum)、遠距教學、超資料文件(Metadata Documentation)、語言學、智財權、數位資源開發(Resource Development)、電腦多媒體展示,及電子佛典製作等。本文僅就與佛學有關的「電子佛典推進協議會」(Electronic Buddhist Text Initiative, 以下簡稱EBTI)(註二)中關於「電子佛典」的發表場次,簡介如下: 

國際電子佛典分類簡說 
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 
  本屆EBTI會議主題可分為佛教檔案資料庫(Archives)、漢文佛典(Chinese Texts)、梵文、巴利文、吐火羅文與俗語佛典(Sanskrit, Pali, Tocharian, Prakrit Texts)、藏文佛典(Tibetan Text)、韓國佛典(Korean Text)、電子字典(Dictionaries)、藏經計畫(Tripitaka Project)與台灣佛典計畫(Taiwan Project)等項目(註三)。 

  由此分類可知,國際電子佛典計畫如以語言分類,可分為漢文、藏文、梵文、巴利文、吐火羅文與俗語等佛教藏經電子化的工作。於此次會中得知有些團體已經解決不同經典語文跨平台的問題,將來查閱單種語言的經文,即可同時比對其他經典語文的時代,應該是指日可待了。其次,如果以其性質分,可分為電子藏經類、電子工具書類及各種資料庫類,工具書類如藏文佛教字典、藏文佛學電子工具書、東亞佛教名相辭典等計畫,這些提供了很好的應用工具。資料庫類,則有大英博物館的敦煌計畫、俄羅斯及布里雅特(Buryatia)的藏文及蒙古文手稿,聖彼得堡的藏文電子目錄(ACIP)等大量佛學書目的出現與檔案資料庫(archives)的建立,這些 
將可提供佛學研究新的資料與文獻(註四)。 

  因為EBTI會議涵蓋範圍頗廣,因此下文再依國際間與「漢文電子佛典」有關的計畫介紹之。 

國際漢文電子佛典現況 
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 
  不同於往年的EBTI會議,本屆特別增列「韓國佛典電子化」及「台灣佛典電子化」的場次。此外,並首度邀請由日本全國主要大學組成的佛典輸入團體(SAmganikikrtam Taisotripitakam, 以下簡稱SAT)與會,SAT目前正進行「大正新脩大藏經原典資料庫」http://www.l.u-tokyo.ac.jp/~sat/big-5/index.html)的建置工作。SAT組織於此次的研討會,主要是就如何「應用XML於敦煌手卷 
資料庫」“Using XML for Dunhuang Manuscripts Database”、「大正藏的缺字(外字)問題」”On the Missing-Characters (GAIJI) of the Taisho Tripitak Text Database”(註五)與「今昔文字鏡簡介」“The Activities of the Mojikyo Font Center (MFC)”等論題報告,會中對日本近年來藏經電子化與缺字處理的進展有詳盡的介紹,同時也說明他們嘗試採用XML以處理文獻與缺字問 
題,且「今昔文字鏡」(Mojikyo)所造的八萬多個可以自由使用的漢字,而其造字的工作還持續的發展與擴大中,因而可解決部份的缺字問題。 

  在韓國的佛典電子化方面,本次會議除了歷屆皆發表的韓國海印寺「高麗藏計畫」外,還有「元曉法師著作的輸入與翻譯計畫」“The Input and Translation of the works of Wonhyo”,本專案 
的目標是將元曉法師全部著作英譯,預計於2000年出版,並發行CD-ROM版本,而電子版的資料將包含中文、英譯及其他傳記資料。另外,韓國東國大學的「韓國佛教全書與及高麗藏韓文版的網路計畫」“The Korean Ancient Buddhist Corpus and the Korean Version of the Koryo Buddhist Canon on the WWW”,他們計畫將韓國佛教全書(Hankuk Bulgyojonso)及韓國海印寺的高麗佛教大藏經的譯本(The Korean Version of the Koryo Buddhist Canon),兩大部總計十五萬頁的資料全部電子化,並預計2006年於網路上公開( http://cache.dongk.ac.kr/project1998/)。在「高麗藏電子化技術方案」“The Technical Solution in the Computerization of Tripitaka Korean”的報告中,則提出KTCS碼 (Korean Tripitaka Code System)的應用方案,其主要的發展是採用「4 Bytes Code System」,亦即將四個Byte的Code分成兩個Word,一個Word 兩個Byte,High Part Word則根據Unicode作為基本碼,Low Part Word則代表擴充碼。《高麗藏》擬採用這種特殊的編碼以提昇檢索效率,並作為與其他編碼系統的轉換碼,然而會場上有些專家則提出不同的看法,他們認為新造的碼等於又是多了一種新的環境,不見得方便交換。除了這場韓國藏經的介紹外,在ECAI會議中亦有兩場專門討論韓國寺院與文化的場次,分別為:GIS and Korean Monasteries與The Korean Cultural Database of 
Korea University。由此可知韓國多年來的藏經電子化工作,已經奠定了相當的基礎,也就是說,韓國佛典電子化的發展已經是不可同日而言。 

台灣佛典電子化簡述 
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄ 
  今年「台灣電子佛典」的討論特別熱絡,除了每年都與會的「台大佛學研究中心」外,今年還增加了許多場次,茲將台灣參與此次EBTI的報告分述如下(註六): 

  一、惠敏法師「中華電子佛典協會與大正藏計畫」“CBETA and Taisho Tripitaka Project”的展示與發表,為國內首次對國際發表「中華電子佛典協會」(Chinese Buddhist Electronic Text 
Association, 以下簡稱CBETA,  http://ccbs.ntu.edu.tw/cbeta/)的成果。CBETA的成果與作業方式,於會中得到很多專家學者的肯定與讚美,同時也確認CBETA的作業方式與方針的正確性,本場的發表 
可說是台灣佛典電子化在國際上一重要的里程碑。

二、Christian Wittern(維習安)的「網結一電子佛典標準化的步驟」“Knots in the Net: Steps to Standardization of Electronic Buddhist Texts”,以CBETA的實際作業經驗,解說CBETA如何運用TEI標準(Text Encoding Initiative, 以下簡稱TEI)、CBETA如何解決作業進行中遇到的種種問題與困難。進而,並介紹CBETA如何藉TEI以完成首期工作,及將來期能達到電子佛典標準化與國際化的各項準備。這場演說得到很多的回饋與迴響,並對台灣採取TEI準則給予許多的讚賞與鼓勵。

三、除了藏經電子化的工作外,「印順法師佛學著作集」“The Searching Functions of Ven. Yin-shun CD”( http://www.yinshun.org.tw)的光碟展示,同時也讓國外的專家學者認識到台灣佛典電子化的多面性,也可藉此機會讓國外學者對中國法師的著作有進一步的瞭解。

四、資訊功德會的「金剛經光碟展示」“The Demonstration of Vajracchedika-sutra CD”,讓大家明瞭藏經的電子化,不但是文字的處理,還可以有各種功能的連結與運用,譬如電子字典的查閱、閱藏、梵唄等功能的運用,藉此展示讓國際間瞭解漢文藏經電子化的多面性。

五、會中並特別安插了「風潮有聲公司」楊錦聰先生,就其所收集的各種佛教音樂做簡介,由於現場有音樂的展示,因此引起很多與會人士的興趣。此場“Buddhist Music and Wind Records”的展示可謂是除了佛教文字、圖像電子化之外,另一種多媒體的呈現與展示。

六、筆者於「佛學網路資訊計畫」“Buddhist Studies Information Network Project”場次中,除了介紹台灣佛典電子化的現況外,並對將來或即將進行的各項計畫作一簡介,讓與會的國內外人士瞭解台灣電子化的近況與發展情形。譬如,台灣大學佛學研究中心與中華佛研所合作的大型「佛學資料庫」建構、台灣大學的「台灣佛教史料電子化」及「網路資料庫」的擴建計畫、「CBETA電子佛典」學術版的研發、培訓台灣新生代參與佛典電子化的工作計畫,以及台灣成立「佛學與資訊」系所的可能,等種種願景做一簡介。期能藉此讓國外學者專家得知台灣佛典電子化的蓬勃狀況,及漢文佛典電子化的現況(註七)。 

  從前述資料中可知,固然電子佛典以語言區分,可分為梵文、巴利文、藏文與漢文等多種,然而從本屆的會議可以看出,漢文電子佛典受重視的程度與技術及困難突破的情況。進而從這些報告中可以瞭解,韓國、日本與台灣的佛典電子化工作,主要還是以「漢文大藏經」為主。易言之,本屆電子佛典計畫中,漢文電子佛典佔了極重要的位置。 

註釋: 
 ̄ ̄ 
註一:所有與會的各國代表對本次的會議,有相當好的讚譽與回 饋。此乃歸功於「中央研究院計算中心」事前的詳細規劃與務實的現場作業,使得全場會議可說是臻至完美。因此,誠如閉幕典禮中EBTI創辦人Dr. Lewis Lancaster 所說的「如何使2000年在柏克萊舉行的聯合會議,超越這次 
在台灣舉辦的盛會,將會是他未來這一年最頭痛的問題」 

註二:電子佛典推進協議會(EBTI),從1993年在美國柏克萊成立至今,即以各種語文的佛教藏經電子化為標的,藉以達成佛典保存、研究、傳播的作用;並以資料分享、跨語言平台為推展項目,以達合作、分享、標準化的宗旨。基於上述標的與宗旨,EBTI 開始進行國際間「學術單位」與「宗教團體」電子化的「推廣」與「協調」工作,不定期於世界各地舉辦研討會議與展示討論等活動,並根據不同的經典語言與工作項目分場次討論,於佛典電子化有很大的推廣效益。有關EBTI的緣起及歷屆研究計畫,請參考筆者於《佛教圖書館館訊》第15期〈當代國際佛典電子化現 
況:電子佛典推進協議會(EBTI)簡介〉一文(http://s1.cy.edu.tw:81/~luminary/library/mag/m15/15-main3.htm),文中對各計畫有概要的描述。 

註三:本文之各種簡介,皆以參與EBTI的計畫為主。此固然不能涵蓋世界上所有電子佛典的計畫,然以此為縮影,對國際間佛典電子化的工作,應可有所瞭解與掌握。 

註四:關於EBTI各場次介紹及其他相關資料,請查閱EBTI台灣網站
http://ccbs.ntu.edu.tw/EBTI/)。並可連結至國外其他各項計畫,藉以掌握世界佛典電子化的實際狀況。 

註五:日本SAT現在是使用JIS code,將來計畫改用Unicode,因為他們目前輸入大約70種電子出版品,總字數超過六百萬字,然其中有15,000字無法以JIS輸入,有1,300字無法以Unicode輸入。因此,其缺字部份擬以「今昔文字鏡」(Mojikyo Font Center, http://www.mojikyo.gr.jp)所提供的八萬多字網上免費下載字型處理之。 

註六:當然,台灣目前從事於佛典電子化的單位,並非僅此而已 。然因篇幅有限,本文謹以參加會議的場次作為樣本說明之。 

註七:上述資料改編自筆者〈從台北看國際電子佛典實況:1999 EBTI會議實錄〉,《現代佛教學會會訊》第二期,1999,頁10-17;下文起,則節編自筆者〈漢文電子大藏經的製作緣起與作業流程 -- 以「中華電子佛典協會」為例〉,《台大佛學研究中心學報》第四期,1999,頁351-373,詳細內容敬請參考原文。