德国book2net古籍扫描仪在古籍数字化与文献利用
古籍数字化成果显著,但其应用也存在不少问题。数字化本身的障碍、研究性质的差异、数字化导致思维方式的转变等因素,都影响到学术研究。因此,在利用时应具审慎态度。只有坚持现代信息技术工具本位,创建个性化的数据库,才能更好地利用数字化文献推进科研的发展。
一般来说,古籍数字化指的是利用德国book2net非接触式古籍,将传统纸质文献典籍转换成为可在计算机上进行操作的过程。这个过程包含两个层级:将印刷、抄写或其他形式的文献用数字方式来表达,属于第一层级;第二层级指的是能够比较客观、完整地反映对象内容与思想的文献,这是数字技术与文献内容的完美结合,数字型的文献能够真实、完整地再现实体型文献的内容。[1]从目前进程来看,第一阶段发展得较好。
总体来看,古籍数字化的进程有几个特点:其一,台湾地区中文古籍数字化建设起步较早。
台湾地区的中文古籍数字化工作从1984年开始,台湾“中央研究院”就着手进行古籍数字化工作。目前,已开发的古籍检索系统有汉籍电子文献瀚典全文检索系统,文物图像研究室资料库检索系统,历史语言研究所藏内阁大库档案。台湾大学中华电子佛典线上藏经阁大正藏全文检索系统,台湾元智大学“网路展书读”等。基本涵盖了唐代以前绝大部分传世文献。其二,香港地区古籍数字化建设成果丰硕。从20世纪80年代末开始,香港中文大学中国文化研究所下属的“汉达古文献数据库中心”所开发的全文数据库资料包括甲骨文数据库、竹简帛书出土文献电脑数据库、金文全文计算机化数据库、先秦两汉一切传世文献计算机化数据库、魏晋南北朝传世文献数据库,中国类书数据库等等。其三,大陆古籍数字化建设奋起直追。从20世纪90年代开始,大陆一些图书馆进行了古籍数字化建设的尝试。
数字化古籍最大的特点是具有检索功能。以《国学宝典》为例,《国学宝典》大型古籍文献数据库全文检索系统,含二千多部重要古籍文献,具有全文逐字索引、字词频统计、智能模糊查询、自动卡片生成等功能,基本上能满足学术研究和科研开发的需要,在辞书编纂、主题查找、统计分析、古书辑佚等方面具有极大的辅助作用。
古籍数字化工作不断进展,最新的成果是由北京大学李铎博士等研发的《全宋诗电子分析系统》。这个系统名称以智能“分析”替代全文“检索”,因为“它是由计算机提供经过分析筛选的条理化的信息,已经带有智能化的特点,可以直接完成一些人力无法完成而又是十分重要的课题,如‘字频分析、‘格律分析'、‘用韵分析、‘重出诗提取、‘话语系统分析'等等。”
[3]据李铎博士介绍,将来可以利用计算机智能化特点,让计算机自主学习,标点《四库全书》。我们深切地期望此嘉惠学林之举能进一步深入。古籍数字化对学术研究产生积极作用,极大地推进了学术活动的深入,给科研注入了创新活力,这些都是业已存在的事实。我们认为,学术研究中最基本的素养就是要善于反思。反思的重要性在于利用检讨的手段达到改进和完善的目的。事物具有两面性的真理告知我们,古籍数字化也是一柄“双刃剑”,看到“利”的同时不能忽略其“弊”。因此,我们应认真对待数字化时代因阅读和写作方式的变化所导致的思维方式的改变。阅读方式傅斯年先生曾主张,上穷碧落下黄泉,动手动脚找资料。重视第一手材料的学术传统,影响到学者的阅读方式。在前计算机时代,边读书边作卡片,几乎是所有先生对弟子的最基本的要求。众所周知,钱锺书先生著述《谈艺录》、《管锥编》是在几大麻袋笔记的基础上完成的。任半塘先生当年在四川大学,用以作笔记的纸片竟然大多是旧报纸和废日历。在这样艰苦的条件下,任先生完成了《唐声诗》和《敦煌歌辞总编》等著作。除卡片式记录之外,另一种重要的阅读方式是边读边作批注,这个传统由来已久,明代李贽、金圣叹,清代脂砚斋都是著例。马茂元先生讲到祖父抱润公手批韩集时十分动情,说:“曩余于家中藏书得先大父抱润公批校东雅堂本《韩集》一部,朱笔细字,遍布书中,手泽所存,珍护靡已。”
传统阅读的笔记和批注,数字化古籍基本上也可以做到,在形式上它们没有截然的分别,但是两者的本质并不相同。纸质书籍无论是装帧排版还是具体内容,其直观性都和电子版图书不一样。纸质图书阅读过程中的翻页动作,以及油墨香味都是电子图书所没有的。这些看似表面的变化,实质上能引起思维方式的改变。苏东坡在《又答王庠书》里说:“书富如海,百货皆有。人之精力,不能兼收尽取,但得其所欲求者尔。故愿学者每次作一意求之。如欲求古今兴亡治乱,圣贤作用,但作此意求之,勿生余念。又别作一次,求事迹故实;典章文物之类,亦如此。他皆仿之。”后人视之为“八面读书”或“一意求之”读书法。东坡读书之法,实际上告诉人们,传统阅读的笔记和卡片中已暗含着读者的思考,隐藏着读者对事物的认识态度和分类意识。每次求一物,勿作它想,这与电子检索查询之间的差异何止十万八千里。写作方式前计算机时代的写作和古籍数字化时代的写作相较,表面形式的不同是前者不具备后者超强的剪切和拷贝功能,其实质区别是由功能引起的构思的变化。纸笔书写和键盘敲打到对文章构思的影响是不一样的,主要因为前者调整难度较大,而后者则随着写作进度随意调整。即就是拼凑文章而言,前者必须具备剪刀和糨糊两种实物,而后者则只需要“Ctrl+X”、“Ctrl+C”、“Ctrl+V”几个键盘就可以任意拼凑了。打个不完全恰当的比方,好比建房子,纸笔时代要通盘考虑,先打好基础,画好图样,准备充足的材料才能开工。而数字化时代某些“大胆的建筑商”只要有构思就可以开工,没有材料,边建边找,所缺材料只要利用数字化古籍的全文检索基本上都能找到。以这种方式建筑的房子,其质量可想而知。
分析古籍数字化利用应注意的问题,还应指出解决方法。我们认为,只有正确的观念才能引导正确的利用。根据以上分析,在学术研究过程中,电脑和人工智能永远只是一种辅助工具,而不能成为学术本身。学术研究中问题意识非常重要,而自觉的问题意识表现在“善于从大量原始文献中发现问题和解决问题,尤能从无疑处质疑,廓清许多积非成‘是'之点。”序章原始文献、质疑精神、廓清是非等都是培养问题意识的基础,决不是依赖电脑检索系统所能解决的。以解决问题为核心的学术研究,计算机和人之间的权界其实是不存在的。因为“人类智能的本质特征和最高表现形式是创造。计算机人工智能模拟人的智能,其难点不在于人脑所进行的各种必然性的演绎推理,而是最能体现人的智能特征的创造性思维,是那些具有某种不确定性的归纳、类比以及模糊推理等,包括学习、修正、推理、复杂条件下的判断等。”也就是说,计算机虽然在一定程度上能够模拟人的思考,甚至在某些方面要比人强得多,但是它不具备人类最本质的创造性思维。举例来说,比如校勘工作,在辨别不同版本文字异同方面,可能计算机要比人完成得更好。但一般的校勘,在比较文字异同之外,判断是非更为重要。这种判断是非的能力决不是设计某种电脑语言程序所具备的,因为这需要深厚的学术涵养和学术积累。
珍藏的历史书刊、古籍扫描是图书馆、档案馆和博物馆面临的一项重要工作,为了可以让更多的人共享珍贵的历史文案,如何快速高效地将书刊和古籍变为可随时查阅共享的电子影像资料,是档案工作者迫切需要解决的首要问题。
book2net(柏耐)非接触式超高速书刊扫描仪的诞生使得这一问题立即迎刃而解。镜头至上的设计,无需拆档,生成电子影像的同时还能保证珍贵原件不受损,完美如初,适用于图书馆、档案馆、博物馆、法院、政府等行业进行快速有效地捕捉文件图像。