“台湾佛教文献数字数据库”的建构与缘起
“台湾佛教文献数字数据库”的建构与缘起
杜正民
中华佛学研究所图书信息馆馆长
佛学研究中心学报
第七期(2002.07)
页391-408
?2002 台湾大学文学院佛学研究中心
--------------------------------------------------------------------------------
页391
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
提要
「台湾佛教文献数字数据库」乃承续台大哲学系杨惠南教授多年来研究与执行的各项台湾佛教相关计划内容,及运用建构「中华典子佛典协会」、「佛学数字图书馆暨博物馆」与其它佛教数据库多年来累积的经验及技术,将相关文献数字化并建构成数据库。期能借网络提供各项方便的功能供读者使用,将台湾佛教文献数据广传于世。
本数据库将从明郑与清朝时期的台湾佛教资料的搜集、编整,经日据时代资料的整编、翻译,至当代佛教文献的汇编等工作,做一完整的整理与研究,并运用最新科技技术将这些文献资料数字化。数据库完成后将置于因特网上,以提供国内外学术界数字参考数据。深信此数据库的完成,不但是国际间唯一的台湾佛教数据库,加上先前完成的多项佛学数据库计划,当更能提供完整的佛学数据,成为国内外佛教学者主要入口网站之一。
除计划内容外,本文亦将介绍本数据库所采用的技术与国际标准,以就教于先进专家,亦可作为其它数字化计划进行的参照与运用,以达资源共享的目的。
页392
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
关键词:台湾佛教、佛教文献、全文数据库、书目检索、数字数据库、佛教网络资源
Summary:
This project intents to integrate humanity and science for the study and creation of Taiwanese Buddhist Digital Database, which will content the largest database in this area. Although Taiwanese Buddhism has its part of importance in this more than 300 years' history. But there are not many researches and reports on this field of studies, not to say the digital databases. Therefore, it is important to establish the only and unique database in the world.
The aim of this project would be to collect relevant historical material about the Taiwanese Buddhism through the Ming-Cheng Period and the Ching Dynasty to present, and analyze the situation and development of Taiwan Buddhist history and thoughts of this period. Then to digitalize all the available material and make it freely accessed on net by users around the world. Hence to lead modern people to understand Taiwanese Buddhism or even the Taiwanese history in all.
页393
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
一、前言:缘起与内容
(一)、缘起
台湾佛教延绵三百余年,为台湾历史与文化的重要环节之一,以往少有学者专注于这方面的研究,研究成果不多,致使时人对于台湾的历史与文化的了解必然有所欠缺与不足,因此,关于台湾佛教的历史与思想的研究计划,为目前所迫切需要的。
加以,于网络科技蓬勃发展的数字时代,综观国内外有限的汉文数字数据库中,可说并无台湾佛教数字数据库的建置,因此本计划拟建置一台湾佛教文献数字数据库,内含完整的图书全文并配合佛学书目数据库,以提供国内外学者从书目检索至阅览全文的未来网络需求。同时,为推展台湾本土佛学于国际间,并将建置完整的「台湾佛教文献数字数据库」(以下简称「本数据库」),期能增进国际间对台湾佛教研究的暸解,进而藉此数据库期能提升国内学术发展。本计划深知,为推展学术于国际间,本土文化的研究是很重要的,尤其台湾佛教研究在国际间尚未为国际所重视,因而为使台湾佛教研究立足于国际间,及提升台湾佛教研究的基础建设,本计划拟先建构「台湾佛教文献」网站,从明郑与清朝时期的台湾佛教资料的搜集、编整,经日据
页394
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
时代资料的整编、翻译,至当代佛教文献的汇编等工作,做一完整的整理与研究,并运用最新科技技术将这些文献资料数字化,以提供国内外学术界数字参考数据。深信此数据库的完成,不但是国际间唯一的台湾佛教数据库,加上先前完成的多项数据库计划,当更能提供完整的佛学数据,成为国内外佛教学者主要入口网站之一。
因此,本计划拟整合当代科技与人文科学建构与研究「台湾佛教文献数字数据库」 (The Study and Creation of Taiwan Buddhist Digital Database),以建置一涵盖自明清以来的文献数字数据库,于网络上呈现完整的台湾佛教史料供国际学者查阅、检索与使用。本计划拟依台湾佛教史料之原始文献 (Primary Source)、国际间有关台湾佛教的研究文献(Secondary Source)、将台湾佛教文献数据电子化 (Digitalization )、并于网络呈现与提供检索功能(Net Retrieval Function)等项目分别进行。同时,为提升台湾佛教数字化技术与学术地位,本计划拟积极参与国际电子学术会议、研发新技术、培训新生代的参与等工作项目,以提升台湾学术发展之基础建设,期能将学术资源做更有效率之整合,提升台湾之国际学术地位。
(二)、计划内容
「台湾佛教文献数字数据库」乃承续台大哲学系杨惠南教授多年来研究与执行的各项台湾佛教相关计划内容,及运用建构「中华典子佛典协会」、「佛学数字图书馆暨博物馆」与其它佛教数据库多年来累积的经验及技术,将相关文献数字化并建构成数据库。期能借网络提供各项方便的功能供读者使用,将台湾佛教文献数据广传于世。
本计划乃立基于杨惠南及多位学者先前几个计划的成果,将之电子化:
(1)「台湾佛教的历史与思想-明郑至日据时期」
(2)「日据时期台湾佛教『四大法脉』的形成及其相关问题之研究」
(3)「台湾新兴佛教现象研究」
其中,(1)和(2)由行政院国家发展委员会所资助。而(3)则由中央研究社会学研究所筹备处所资助。第(1)个计划系整合型研究计划,由四位来自不同学术机构的学者,各提出不同的子计划,然后进行三年(1997年8月-2000年7月)的研究。(详下)第(2)个计划,是个人型的单一计划,为期两年(2000年8月-2002年7月)。这两个计划的共同目标则是文献的汇集和整编;其中包括清代
页395
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
各种方志的汇整、日据时期代表台湾佛教主流的《南瀛佛教》月刊日文汉译。而第(3)个计划为期四年(1997年3月-2001年4月),以战后台湾佛教新兴教派为研究对象,包括慈济功德会、佛光山、法鼓山、中台禅寺,以及现代禅、新雨社、维鬘佛教协会、万佛会、佛教青年(基金)会、关怀生命协会、同梵精舍等新兴的台湾佛教教派和团体,并旁及宋七力显相协会、法轮功等与当代台湾佛教相关的教派和团体。进行方式除了平面数据的汇整之外,还包括主要人物的访谈。
二、赞助单位、计划主持人与工作分配
本计划蒙蒋经国学术基金会及中华佛学研究所赞助,于此特别致谢。[1]
如前文所述,「台湾佛教文献数字数据库」乃承续台大哲学系杨惠南教授多年来研究与执行的各项台湾佛教相关计划内容,将相关文献数字化并建构成数据库。期能借网络提供各项方便的功能供读者使用,将台湾佛教文献数据广传于世。因此,需要有特殊的专业技术,是以拟借重中华典子佛典协会、佛教数字图书馆暨博物馆与其它佛教相关计划多年来累积的经验及技术,于国际化方面,则邀请国际间研究台湾佛教的著名学者 Dr. Charles Brewer Jones 参与。
是以,这个团队是由数字学有专长的专家学者参与及分担工作,无论是于文献数据内容的提供,信息技术的研发与移转及国际化的表达等可说是一完美的团队整合,今简述各主持人及其专长如下:
1. 主持人:释惠敏,为国立艺术学院教授兼教务长与共同科主任。并担任「中华电子佛典协会」主任委员,负责大正藏电子化的工作。具丰富的行政经验,足以协调本计划的各项作业。
2. 共同主持人:杨惠南,任教于台大哲学系,近年来从事台湾佛教的研究不遗余力。并累积相当多的数据,唯此数据尚未进行电子化的作业,因此
--------------------------------------------------------------------------------
1. 由于该会应允赞助半数金额,另半应寻得其它单位赞助始能执行本计划,于此特别致谢中华佛学研究所所长李志夫教授欣然同意协助,使本计划能顺利执行。
页396
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
于本计划将致力于各项资料的研究与提供。
3. 共同主持人:杜正民,任教于中华佛学研究所,兼佛学网络信息室主任暨图资馆馆长,并担任中华电子佛典总干事及负责「佛学数字图书馆暨博物馆」等网络工作,具多年的佛教数据库与网络工作经验。
4. 国外合作主持人:Charles Brewer Jones,目前任教于 The Department of Religion and Religious Education, the Catholic University of America. 其博士论文为 Buddhism in Taiwan: an historical survey (China, folk religion, zhaijiao), 并出版有 Buddhism in Taiwan: Religion and the State, 1660-1990 (Honolulu: University of Hawaii Press, 1999)等书,为国际间研究台湾佛教的著名学者。
因此本作业计划拟依上述主持人的专长分工如下:由杨惠南负责内容 (Contents) 的建构,Charles Jones 则负责英文资料的建构与搜集,杜正民负责网络(Net Technique)与数据库(Database)的建置,由释惠敏就上述各内容负责统筹与分工等协调作业。
进一步说明之,计划主持人释惠敏现任「「中华电子佛典协会」(CBETA)」主任委员,负责大正新修大藏经一亿多字的电子化工作,目前已有相当的成效展现于因特网上 (http://www.cbeta.org) ,此项兼具普及化与学术化的作业,已获得国内外许多单位与学者的赞赏,对本计划数字化的工作将有相当的帮助。另外,本计划共同主持人杜正民从事「佛学网络数据库」(http://ccbs.ntu.edu.tw) 建构多年,这时期除了累积不少经验外,还建构许多的网络数据库,涵盖有「佛学书目数据库」、「佛学全文图书数据库」、「佛教电子大藏经」等大小网站总计二十余项,颇获各界好评。杜正民于民国八十五年至八十七年间,曾协同释恒清教授完成蒋经国国际学术交流基金会补助的《佛学国际网络数据库》之网络建置工作,此一雏型数据库普一推出,即获得国际间的好评与肯定,并多次受邀于国际会议中发表论文与展示成果。因而本计划拟运用现有的发展基础与经验,开拓此学术领域,使台湾的佛教研究成为国际学术重镇。深信,立基于上述已有的数据库建置经验,当可迅速完成本计划。
于此特别强调,本计划拟完全着重于台湾佛教数据的建构,《佛学国际网络数据库》因为该计划当初并未包含「台湾佛教资料」的搜集与建构,因此只着重于「中国佛教数据」的建置,此为两者间最大的不同。将来完成「台湾佛教文献数字数据库」的建构后,此两数据库拟放在同一部主机 (http://ccbs.ntu.edu.tw) 继续由杜正民统一管理,深信此两个建置完成的数据
页397
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
库,将会是国际间最大型且最完整的汉文佛学数据库。
加以,各共同主持人皆已有多年的学术研究或网络数据库建构经验,颇获各界好评。因而,于本计划的数据来源、稿本写作、技术专才、美工设计等都有相当的经验。是以,基于目前各共同主持人的丰硕成果及实务经验,可说本计划已经有一现成的架构与数据,只要假以时日即可使之臻至圆满。因此可说,本计划的一大特色,就是可以迅速将数据库的资源转为本计划所需的数字数据,以利进行与完成。最重要的,我们所完成的数据完全都是属于公共领域 (Public Domain) ,可提供使用者作二次加值开发及研究学习之用。因此,本计划拟于完成各项作业后,除保留一份于本数据库主机外,将提供所有的全文数据置于其它文献数据库中,或以镜像 (Mirror Site) 的方式提供国内外学术界查阅、检索、下载、编辑等功能,以达专业分工、数据共享的现代化需求。
总之,计划主持人与共同主持人均系各个分工责任范围内之专家,不论于学术研究与计划执行的能力上,均有丰富的经验,诚为此一计划之最佳人选。且各主持人学经历涵盖诸领域,在此一科际整合之契机下,必能对本计划之课题提出多面向之丰硕研究成果。[2]
三、本数据库内容
本研究计划的目的,即是建置一个具有高质量内容,且能够充分展现结合信息科技、艺术与人文社会科学研究成果的大型「台湾佛教文献数字数据库」,以期能藉由这个计划的成果,展示台湾学术研究在因特网社会中所能发挥的重大影响。今先就计划内容做一简介--台湾佛教,就历史观点及思想差异的观点来看,可以分一、明郑时期与清朝的台湾佛教;二、日据时代的台湾佛教;三、战后台湾佛教等三个阶段。因此,本计划拟依下述内容进行:
(一)、明郑时期与清朝的台湾佛教
这一时期的台湾佛教,其特色是名士佛教。这可以由两个方面来说明,
--------------------------------------------------------------------------------
2. 本段有关申请人的资料大部分摘录自计划申请书,有关笔者部分或有溢美之词,敬请谅查。
页398
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
首先,就这一时期的佛教寺庙来看,主要是明末遗臣或是郑氏遗臣所兴建。其次,此一时期的名士佛教,遗留下许许多多的诗词歌赋,透露出当时佛教发展的概况,成为台湾文化史上的瑰宝。而清朝佛教,其特色是禅净双修与神佛不分。这些特色具体而微的表现于台湾各种方志内。因此,本计划拟就明清时期与佛教有关之台湾各地《地方志》、《台湾历史文献丛刊(方志类)》、《台湾历史文献丛刊(明郑史料类)》、《台湾通志》、《台湾方志集成:清代篇》及《台湾历史文献丛刊(诗文集类)》、《台湾诗录》等数据建构全文数字数据库。
(二)、日据时期的台湾佛教
日本政府统治台湾期间,于大正十年(1921)四月四日成立全台湾性的「南瀛佛教会」,这是管理台湾佛教的最高当局,「南瀛佛教会」成立的主要目的是要培养佛教在家、出家的弘法人材,此外也出版机关刊物,以利佛教之传播。该杂志发行年代长达十九年之久,可以说是日本统治后期台湾佛教的最好见证。是以,本计划拟就共同主持人杨惠南数年来执行各计划所完成的《南瀛佛教》翻译原稿,承制为电子文件。并将此大量数据置于网络数据库提供人文需求,以利使用者阅读、检索及下载等功能。
(三)、战后时期的台湾佛教
二次战后的台湾佛教可以分为两个时期,第一个时期是戒严时期的台湾佛教,第二个时期是解严之后的台湾佛教。
1﹒戒严时期的台湾佛教
戒严时期的台湾佛教主要是由大陆来台僧侣所形成,因为这些僧侣大多来自大陆苏北,因此可说是苏北佛教的延伸。苏北佛教所表现的亦是净土宗一宗独盛的特色,这一特色由这些苏北佛教的代表人物带到台湾来,成为战后戒严时期台湾佛教的重要特色。举凡在这一时期所发展出来的台湾佛教主要团体,例如台北的中国佛教会、高雄的佛光山、台北的法鼓山等等,大概都和苏北佛教所宣扬的西方极乐世界净土信仰有关。因此,本计划拟就现有之各类佛教期刊搜集完整的文献资料,提供「书目与全文」等数据。此外,本计划并将配合网络的发展提供珍贵的「影音图像」,以作为台湾近代佛教史的缩影。「书目文献」与「影音资料」两部分如完成,可谓是台湾当代佛教资料的大成。
页399
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
2﹒解严之后的台湾佛教
战后第二个时期就是解严之后的台湾佛教,过去在戒严时期由于政治的禁忌而无法发展的一些教派,在解严之后迅速的开花结果。解严之后,人间佛教的理念迅速的开展,在这一时期所成立的一些小的教派,例如台北的新雨社、台北的现代禅、台南的维鬘,及台北的万佛会等新兴的佛教团体,在解严后的特殊社会情况下,应运而起。因此,本计划拟就现有之文献建立完整的数字数据库,提供国内外学者最新、最完整的台湾佛教研究资料。[3]
(四)、本计划之必要性
台湾佛教是台湾历史与文化中不可或缺的一环,过去少有学者注目,本计划希望透过资料的搜集、汇编、整理和分析及数字化等作业,为明清、日据时期及近代的台湾佛教历史与思想留下完整的文字与影像纪录,完成数字数据库置于网络上,并提供良好的电子工具,以方便相关学者参考之用。
四、使用之标准与技术
本计划之完成,除了完整与大量台湾佛教文献内容 (content) 外,并拟建立完善的交换标准,作为建构多媒体形式知识结构。本计划拟依下列标准建构「知识基本表达」,如以计算器的数据结构、知识属性整理、内容的外化 (形式化)、 知识结构等准则,以完成「台湾佛教文献数字数据库」。
本计划拟参照「「中华电子佛典协会」」进行的佛典大量数据库、佛典全文数据库与「佛学数字图书馆暨博物馆」所进行的佛学书目及全文数据库的建立外,并拟订定佛典标记 (Markup) 菜单、规划 XML (Extensive Markup Language) 作为标记工具、修编适合电子佛典制作的国际编码交换协议(Text Encoding Interchange, TEI)、连结佛典信息超文件 (Hyper-text)、及汉文计算机缺字 (Rare Characters) 处理及图档的处理,甚至跨国语文环境与汉文数据呈现于不同平台的考虑等作业,皆是本计划所需面临与进行的。为解决上述问
--------------------------------------------------------------------------------
3. 本计划内容,乃依杨惠南教授多年来执行的计划为主,因此本段文字参照杨教授提供的数据所改写的。
页400
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
题与困难,本计划拟结合相关的学者专家共同解决困难与问题,配合上述需求开始各项技术性的研发。
今试以本计划正进行中的《南瀛佛教》全文及影像处理为例,介绍拟使用的标准如下:
(一)、《南瀛佛教》全文数据库以《电子文献文献编码与交换导览 TEI》为标准
本计划的正进行中的电子化《南瀛佛教》文献全文标记作业,完全依 Michael Sperberg-McQueen (Univ. of Illinois, Chicago) and Lou Burnard (Oxford University)所著的《电子文献文献编码与交换导览》 Guidelines for Electronic Text Encoding and Interchange (TEI P3/P4) 为标准。此书除 TEI 标准外,并含 TEI Document Type Definition (DTD)。(有关 TEI 数据可参考网页数据 http://www.uic.edu/orgs/tei, 或 http://etext.virginia.edu/TEI.html) 。
本计划主持人释惠敏与共同主持人杜正民,于进行「中华电子佛典协会 (CBETA)」的《大正新修大藏经》电子化作业时,即开始使用 TEI 的标准,CBETA 多年的经验及改良东方文献与汉文佛教文献使用 TEI 标准的问题,增进国际间文献编码交换。上述经验,目前已转换为本计划工作实务,并完成《南瀛佛教》的标记作业。
(二)、全文的建置内容,为能达国际交换的标准,拟以 XML 作为标志语言
至于内容外化的部份,则拟采用符合国际标准的 XML 标志语言 ( http://www.w3c.org),做为机器解读与形式表达之用,不但可以作为国际交换标准,并且还可以作外化内容之间的联系关系,进而构成一知识结构体。本项作业,在《大正新修大藏经》电子化作业时已经有相当的经验,该部份可谓是当代汉文数据中,采用 XML 作为原始文件的最大数据库。
本计划《南瀛佛教》文献数字全文作业皆以 XML 为主。目前已完成所有文献的 XML 转文件作业,今后将以此 XML 檔作为主档 (Source File),再依需求转换为其它各种格式档案。同时依既定步骤进行,《南瀛佛教》目前已完成 DTD 及标记等作业。
(三)、图像数据库 (Image Database)管理
为能提供读者正确完整的一手数据,本计划的进行除了《南瀛佛教》日
页401
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
文数据的翻译、数字化之外,并拟提供《南瀛佛教》全文图像数据档,以便对照与运用。并期望能提供大量的佛教图像,以利读者使用。因此,图像数据的建构与管理即成为重要的课题。
本计划可藉共同主持人多年来的工作经验,以确立本计划目标与任务的方式进行,譬如依国际标准、所需设备、应用软件等需求,建立协议 (Establishing Protocols)、 摄影协议 (Photography Protocols)、数字化协议 (Digitization Protocols) 等方式,进行建立计算机之间通信与数据传送所遵守的规则,以达成图像影像文件的方便交换与管理之目的。
因此,本计划将采取 Huntington Archive of Buddhist and Related Art 佛教图像数据库的实务经验,如影像校正 (Image Correction) 的实际经验,考虑采用具有自动功能的高速扫描仪 以最高分辨率扫描等实务工作,提高质量。加上,该数据库所提供的「工作上常犯错误」与「改进方案」等实际经验,当可作为本计划的最佳务实参照。
(四)、数据将依 MetaData 标准,建立专业领域之共同后设数据
由于本数据库需要制作大量的图像文件,因此 MetatData 的诠释数据就很重要。因此,有关文物图像的表达,本计划将以专业领域共同之后设数据 (Metadata) 作为标准,辟如参照「数字博物馆资源组织与检索相关规范工作小组」(Ross 小组) 所规范的 MICI 都柏林核心集 (Dublin Core http://purl.org/DC) 之中文诠释数据交换格式 (http://ross.lis.ntu.edu.tw/document/metadata/) 。同时,将参照国外 CIMI 机构
(the Consortium for the Computer Interchange of Museum Information, http://www.cimi.org/documents/meta_bestprac_v031.html) 的各项标准进行作业。
此外,拟采取国际通行的 Dublin Core标准,以其十五个元素 (DC.Title, DC.Creator, DC.Subject, DC.Description, DC.Publisher, DC.Contributor, DC.Date, DC.Type, DC.Format, DC.Identifier, DC.Source, DC.Language, DC.Relation, DC.Coverage 及 DC.Rights) 记录所有电子化数据的属性,以之作为先制资料。以利作业人员或使用者运用这些项目来管理电子文献数据及文物项目,并将参照 Z39.50 作为检索与交换的标准。
Metadata 于佛学文献数据的电子化是一重要的概念,尤其在佛学书目的管理,以及佛教文物图像的电子化,皆可采用 Dublin Core 的十五个元素作
页402
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
为标准建立先制数据,以做检索与交换之准则,因此本数据库的全文数据亦将以 Dublin Core 的格式建构。
(五)、缺字(Rare Characters) 的管理、呈现、检索等问题
除了技术的突破及标记作业外,计算机缺字处理也是佛教文献数字化的另一重要课题。虽然国际间试图解决缺字的方法有很多种,本计划关于缺字处理的初步工作,则着重于「一般组字式」作为表达缺字的方法,以便使用者能在纯文字环境下阅读,不需另外安装造字档或是图档而设计的,因而采用系统字 (Big-5) 的组字方式。这种方式除了提供了阅览、散播上的便利性外,也不会占用使用者对造字档自行运用的空间。
当然,不同的缺字表达方法各有其利弊,因此本数据库在以 XML 表达的主要档案 (Source File) 中,则建立缺字的转换数据。使用者可依建立的缺字数据库,自行转换成其它的缺字表达方式,甚或转为将来拟采用的 Unicode 码。简言之,本计划乃采用 CBETA 的缺字处理方式,分为编撰 CB 码、组字式、「今昔文字镜」M 码、通用字及 Unicode 几部分,以便将来的数据整合与分享。
总之,本计划采用上述标准的目的,主要是以能建构「知识基本表达」,达国际交流,资源交换的标准为目的。确定编码与格式等标准,建构一个格式统一的佛教数据交换标准 ,不重复工作避免资源浪费与降低成本等,以达成资源共享的目的。
五、进行步骤与方法
为达预定的成果,本计划拟分两年四期完成所有的作业。
由于主持人与共同主持人多年来的工作经验与文献资料量的累积,因此本计划当可在最短期内完成最大量高质量,且足以代表台湾文化的「台湾佛教文献数字数据库」精致作业。今将计划进行步骤分述如下:
第一年度:
第一期:完成明郑与清朝时期台湾佛教数据,以及《南瀛佛教》刊物之
页403
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
搜集、整编、分类及日文翻译等作业。
第二期:完成上述各数据的英文数据与介绍,同时也完成电子文件及相关作业,如 TEI/XML 文件的作业等项目,并将数据置于网络上测试。
第二年度:
第三期:完成战后的台湾佛教部份:戒严时期的台湾佛教与解严之后的台湾佛教的全文数据与影音数据之搜集分类与汇整等作业。并做成英文资料。
第四期:完成影音数据 Metadata 的建构、图像数据库 (Image Database) 建置、文献全文数据库大量 TEI 标志(Markup)及 XML 原始文件(Source file)作业,研发人文需求的检索软件等项目。
至于此四期的作业方法,则将按照搜集文献、缮打资料、全文校对、建构数据库、测试上网等程序,于二年内依输入、计算机校对、人工校对、标记工作、测试、上网等方式执行。并配合各项技术,研发人性化的检索软件,提供良好的学术工具。
简言之,本计划将按部就班以确定主题范围、收集、累积、整理、翻译、缮打数据,及研发检索软件、确定软件需求、测试完成、上网流通等方式完成作业。最后,配合全文检索功能及现代科技的应用,将所完成的「台湾佛教文献数字数据库」置于网络上流通,以供国内外学术界自由使用与下载。
六、目前已完成的资料与成果
经前述所拟定的使用标准与技术及拟进行的步骤与方法后,当可确知本计划将完成的工作项目与具体成果,今再分述目前已完成的工作项目与具体成果如下:
(一)、依进度完成前述既定之各项作业进度
以文献而言,以现代的科技与网络技术完成完整的明清与日据时代的台湾「文献数据」等数据库。同时并完成网页数据的英译作业,以中英方式呈
页404
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
现于使用者面前,期能使「台湾佛教文献数字数据库」成为国际间最完整最高质量的数据库。兹将第一年度已完成的数据简列于下:
本计划目前已完成明清时期与佛教有关的台湾《地方志》、《台湾历史文献丛刊(方志类)》、《台湾历史文献丛刊(明郑史料类)》、《台湾通志》、《台湾方志集成:清代篇》及《台湾历史文献丛刊(诗文集类)》、《台湾诗录》等数据建构全文数字数据库。
同时,也完成《南瀛佛教》日文翻译稿,并承制为电子文件。建构完整的 XML 文件及 TEI 标记作业。并将此大量数据置于网络数据库以利使用者阅读、检索及下载等。进而,并完成《南瀛佛教》所有数据的图文件扫描工作,并拟于短期内与上述建构的文字文件连结做比对等作业。以提供使用者翻译稿及完整的扫描数据作研究。
最后,于本计划进行的同时,借助于各主持人的经验与资源,就相关的网络呈现方式与设计或信息技术的运用等,完成网页基本架构的建构与最后的改版作业,期能提供读者完善的网络功能。如提供友善的界面,本数据库的呈现方式,因为希望能提供给大众使用,因而参照目前市面上较受欢迎与较广为流通的方式,譬如参考市面视听数据,如各种百科全书光盘制作的界面与呈现等方式,完成本计划的呈现与展示。至于数据库的检索,将以「专题」及「分类」为主要检索方法,及提供「多版本整句 (全文)检索」功能,以利读者比对各种版本与文献资料。此外,将参照《大英百科全书》的检索方式,完成「现成检索词汇」等工作。并且,设置「常被检索的词汇与用语」,如「Top 10」的设置等,以适合非学者专家的使用。
简言之,本计划第一年度完成的进度与成果如下:
1.完成网页架构作业
2.完成明清时期文献电子化作业
3.完成日据时代 南瀛佛教 文献电子化作业
4.完成日据时代 南瀛佛教 TEI/XML 作业
5.完成南瀛佛教 图像文件作业
6.完成南瀛佛教文次与图像比对作业
7.完成网页修订改版、检索功能、界面呈现等作业。
(二)、完成上述文献数据后,依规划的架构设计测试网页
兹将本数据库进行的部份作业,作一简单的网页测试样本与说明:
页405
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
测试网页 解说一
本数据库依一、明郑时期与清朝的台湾佛教;二、日据时代的台湾佛教;三、战后台湾佛教三个阶段设计网页 (如下图左栏「选项」)。并依各时期提供完整的台湾各地《地方志》、《南瀛佛教》以及当代文献等数据建构全文数字数据库 (如下图右栏「主画面」)。
同时,根据TEI/XML 国际标准进行内容外化的作业,除了资源可以与国际共享外,同时也可提供全文数据供使用者阅读、下载使用等。 (如下图「主画面」)
页406
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
测试网页 解说二
本数据库依上述三个时期建立完整的书目与全文数据库,并提供良好的检索软件,以发展人文需求的检索软件,以利读者检索查阅 (如下图「主画面」)。
查阅结果可提供完整的图书书目信息,并可连结至全文,或提供部份说明,使用者不必到图书馆即可得知所需的资料是否为其所需 (如下图「主画面」)。
页407
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
测试网页 解说三
本数据库不但提供查阅所需信息外,并能连结全文。因为本数据库内含完整的图书全文并配合佛学书目数据库,以提供国内外学者从书目检索至阅览全文的未来网络需求。
除了全文的提供外,并将配合研究需求提供各种「参考工具」与「影音数据」等多媒体功能 (如下图左边「选项」),并以 Metadata 建构完整的数据库。
页408
「台湾佛教文献数字数据库」的建构与缘起
佛学研究中心学报第七期(2002.07)
以上为本数据库目前已完成的测试网页,然为能提供良好及友善的界面,本数据库目前尚对此网页进行改编与修订中,待计划执行周年后当会开放使用时 (http://ccbs.ntu.edu.tw/Taiwan),将会有焕然一新的网页呈现于读者面前。
七、结语:发展方向
总之,本计划于主持人释惠敏的统筹与协调下完成所有的工作项目。亦即,由共同主持人杨惠南负责内容 (content) 的建构,完成包含自明郑以来完整且大量的「台湾佛教文献数字数据库」。在网络技术 (Net technique),则由共同主持人杜正民提供最新的网络科技,及具人文需求的网络功能。此外,本计划除重视国内使用率的提升外,对于国际使用者的应用也很重视。因此,由国外共同主持人 Dr. Charles Brewer Jones 负责英文资料的建构与撰写。以期完成中英文解说,引导国外的读者使用,以发扬台湾文化于国际间。
本数据库将以国际性及学术性作为主要的诉求,亦即完成以 XML 标记 TEI 国际文献编码标准、以 Unicode 国际码表达的「台湾佛教文献数字数据库」,亦即以「标准化」与「国际化」作为本数据库的发展目标。其它,如提高数字化制作技术,如何让读者方便使用、解决在不同的平台使用数据的问题、如何让数字数据转化为彼此相通的码等国际间资源交流的问题,也是本数据库目前正进行的方案。
简言之,本数据库最重要的是工作目标,就是依序完成前述各项计划,建构完整的台湾佛教文献数字数据。建构一适合当代需求的佛学专业网站,提供专业的服务。
欢迎投稿:307187592@qq.com news@fjdh.com
QQ:437786417 307187592 在线投稿
2.佛教导航欢迎广大读者踊跃投稿,佛教导航将优先发布高质量的稿件,如果有必要,在不破坏关键事实和中心思想的前提下,佛教导航将会对原始稿件做适当润色和修饰,并主动联系作者确认修改稿后,才会正式发布。如果作者希望披露自己的联系方式和个人简单背景资料,佛教导航会尽量满足您的需求;
3.文章来源注明“佛教导航”的文章,为本站编辑组原创文章,其版权归佛教导航所有。欢迎非营利性电子刊物、网站转载,但须清楚注明来源“佛教导航”或作者“佛教导航”。