程式设计观点看--香光尼众佛学院“佛学文献资料库”
佛教图书馆馆讯 第二期 84年 6月
【电脑V?S资料系列】
程式设计观点看
--香光尼众佛学院“佛学文献资料库”
东吴大学中文系教授 陈郁夫
三月初,香光尼众佛学院图书馆自衍师父有意让我为“佛学文献资料库”尽些心力。三经往返,雏型初就,忍不住借此园地介绍给有意从事类似系统设计者参考。
“佛学文献资料库”的内容是佛学论文讯息,包括:题目、作者、出版、卷期、页次、时间、关键词、提要八项资料,由于各项资料有一定格式,长度大体一致,较适合设计成 dBASE3 式分“栏位”检索。但“栏位”式检索有一重大缺点,就是有些讯息会遗失,譬如今人写论文,有时题目之外尚有副题,所以整个题目可能长达六十字以上。题目若设定三十字长,副题讯息便遗失了。为著避免遗失讯息,尽量加长各栏位长度是解决之道,这样又会浪费大量记忆体,使资料长大很多倍。为著避免上述缺点,本资料库不定栏位,全部讯息放于一处,采“全文”检索方式,这样做对其中将近三百字“提要”一项,最为相宜。
“全文”检索虽可以找到一切资料,但有速度慢、和资料可能浮滥的缺点。速度慢一直是“全文”检索之痛,还好硬体愈来愈快,我们的字串比对功能又强,已可做到不做任何资料加工就可满足速度要求了。资料浮滥的缺点则要在设计上用一些巧思。首先在资料“登录”时,依论文发表年代先做“分类”工作,这样一方面可在选单上缩小检索范围,一方面等于论文发表“年代”一栏可做“大于”“小于”“指定”等选择。其次,在输入检索字串之后,可指定检索项目,这样大致可以做到像“栏位”检索一样精确。这样一来,“佛学文献资料库”便兼具“全文”和“栏位”二重优点。像这样的资料库,据我所知,尚未有闻。
本资料库分“检索”“登录”“维修”三模组,“检索”模组给三宝弟子和学界免费使用,“登录”和“维修”模组则给香光尼众佛学院内部使用。三者可统合在一个外框上。“登录”模组登录资料采用“整档”输入,意思是原始资料可在自己习用的编辑器下制作,只要遵循一定格式就可以。如此一来,只要有人发心,便可替佛学院输入资料。由于资料分头制作,可能会有重复,“登录”模组会将重复资料滤掉,甚至将可疑资料摘出,以便修正。可用一般编辑器制作资料、筛除重复与可疑资料以及自动分类,三者是“登录”模组值得介绍给行家的功能。
在“维修”模组中,做的事约有以下数项:
第一、可以了解资料库的情况(有多少笔资料、使用多少记忆、各链有多少笔、键词
分布等)。
第二、可删除或修改一“笔”资料。修改一“笔”资料时,可以使用自己习用编辑
器。
第三、可删除或浏览一“链”资料,并可将整“链”倾存成档案。
资料库一经维修,往往会留下垃圾,我们也提供清除和重整的功能。
“检索”模组是这系统成败的关键所在,我们特别用心,力求速度快、使用便、功能全三项要求。速度快要快到不感觉要等,使用便要便到生手一看就会,功能要全到应有尽有。当然,从绝对的观点看是做不到的,所以以上的话都只是相对上说的。
(一)速度快
将来无论资料多大,我们都希望十秒之内找到一切资料。由于不断有讯息在萤幕出现,十秒并不会有等待感觉。
(二)使用便
为著做到使用便,我们以“视窗”为基本架构,尽量使用“选单”等以增强使用者方便,并以“状态列”让使用者明白怎样用。使用者除了输入检索字串之外,其余都可不用费心。
(三)功能全
由于需求不同,不易完全满足所有使用者。不过我们提供以下功能,相信不会短于任何其它软体:
第一、检索提供“单词”“且”“或”“键词”四种。
单词:不限长度。
且:等于逻辑and,做逻辑【且】的词不限长度,个数也不限。
或:等于逻辑or,做逻辑【或】的词不限长度,个数则限三个。
键词:一般称为关键词,本资料库内建成B+ Tree,可立即找到资料。
第二、检索进行中,系统会报告各年代有多少“笔”,检索终止,会加总。
第三、处理检索所得资料,分“整体”和“分笔”。
整体:不看资料,整体存档或列印。
分笔:分笔看资料,选出想要的资料再存档或列印。
第四、分笔看资料我们分“详、略”二栏。“略”栏只显示题目和作者,便于整体了
解;“详”栏则当游标在“略”游动,自动更新。“提要”则按功能键再显
示。
第五、存档与列印可选项,并依选项做适当格式处。
第六、举凡检索过的资料系统会保存,可免重新检索之苦。
佛教资料浩如烟海,披索困难。因此,有志佛学研究者,十分盼望有人早日将有关佛学资料电脑化,以免浪费时日在搜寻资料上。佛教资料大体可分二种,一是原典,一是相关研究成果。原典的电脑化刻不容迟,而相关研究成果亦十分重要,香光尼众佛学院“佛学文献资料库”属后者。
常听人说:“某某经已输入电脑了。”这应该指的是把某经典制成“本文档”而言。本文档是一序列ASCII code,没有其他排版方面的讯息,一般编辑器都能阅读,可以是电脑最基本资料。这些本文资料让它们维持档案型态,用TS或GREP等在档案中找资料的工具去找,当然可以,但是十分不方便。为此,制成“资料库”恐怕是必要的工作,这样才能迅速找资料到并做维护工作。
制成“资料库”需要一个资料库管理系统,国内一般都用dBASE3之类的资料库管理系统做,这对适合“栏位”的资料已有资料膨胀和遗失的缺点,对“原典”则全不合用。本人开发的“龙泉一号”“龙泉二号”等全文检索系统,便是专门为补足这一缺憾而撰。“一号”我们用它制作了一些像《楚辞》《庄子》《荀子》等较小的古典文献,佛典也有《圆觉经》《法华经》等十余种,分送想要的学者使用。更重要的是“一号”免费开放给学界使用,学者可以完全自制自己想要的经典。
很高兴能为香光尼众佛学院设计这个资料库,它补足“龙泉一号”对“栏位”式资料的功能不足,将来预备修改成通用形式,让有意制作的人有比dBASE3强的软体可用。老子有言:“自夸者无功。”在此“自夸”,当然也“无功”。还好软体这样东西,可以验证,是否如实,有使用者可以勘验。为人设计程式有些像为人建房子,希望建好之后,宾主皆喜。访香光寺,见有善信合力布施共同为扩建香光寺办佛学院而努力,颇为感动。后知香光寺未来有意成为佛学资讯中心,愿不可谓不大。乐于助成其事,以添一段善缘。
【编者案】:
本系统目前还在测试中,若您对系统软体设计部份有兴趣,请直接与程式设计者连络。
欢迎投稿:lianxiwo@fjdh.cn
2.佛教导航欢迎广大读者踊跃投稿,佛教导航将优先发布高质量的稿件,如果有必要,在不破坏关键事实和中心思想的前提下,佛教导航将会对原始稿件做适当润色和修饰,并主动联系作者确认修改稿后,才会正式发布。如果作者希望披露自己的联系方式和个人简单背景资料,佛教导航会尽量满足您的需求;
3.文章来源注明“佛教导航”的文章,为本站编辑组原创文章,其版权归佛教导航所有。欢迎非营利性电子刊物、网站转载,但须清楚注明来源“佛教导航”或作者“佛教导航”。