关键词:古籍扫描仪 非接触式扫描仪 书刊扫描仪 v型书刊扫描仪
古籍扫描仪长久以来,很多人出于对中国传统文化的热爱和保护,致于古籍数字化的研究开发工作。虽然做了不少的工作,但是成就却良莠不齐。其原因有三,一是虽然现有的计算机技术使大量的古籍实现了网络化、数字化,但是对于一些生僻字、古字却束手无策。中华文化博大精深、源远流长,许多汉字今人看来是古字、生僻字甚或死字,但它们对于历史和文明的考证却是不可或缺。就像我们在探究汉字起源时所经常用到的《说文解字》、《康熙字典》等字书类古籍就是因为含有了大量的生僻字,至今仍无法很好的实现通用的数字化版本,这不能不说是一大遗憾。许多的研究人员,竟然在无奈中熟练了亦步亦趋的造字技术。其次,或许是有些出版人的愿望吧,“普及传统文化从青少年抓起”,由此带来古籍出版物中大量的使用简体字,而简体字一字多义的特点,非常不利于古籍在传承中保持原汁原味,同时亦降低了其固有的版本价值,更遑论研究价值了。还有一个是错误率的问题,或许是录入的底本原因,又或是编校中的程序问题,总之,一些所谓的电子化古籍产品中的错误漏洞颇多,极大影响古籍的使用和研究价值。
根据清代陈昌治刻本的影本整理的《说文解字》现代版及数据库日前已由社科文献出版社正式出版发行。这套图书和数据库光盘出版后已在高校研究领域、数据库公司、排版厂以及广大文史爱好者引起强烈反响,可以预测,它将在古籍的数字化整理方面带来一场深刻的变革。
众所周知,计算机采用的二字节编码技术只能处理大约2万左右的汉字,那些无法处理的生僻字只有通过造字来解决,从而给学术之间的交流和传播带来了很大的不便。如今,这个瓶颈已经被突破。《说文解字》现代版及数据库在技术方面最大的特点就是采用最先进的Unicode扩展技术,使计算机可处理的文字种类数达到7万之多,并且可以自由的进行复制、粘贴、发布再利用,从而结束了古籍研究手工抄写、图片替代、生硬造字的时代,也为研究者、古文字爱好者查阅、认知、流通生僻字、罕用字提供了便捷的途径,使得在信息化时代,对于中华文化的保存和发展具有极为重要的意义。与此相应的另一个值得称道的则是它便捷、先进的自然语言检索技术,在平常研究过程中翻书查找资料的艰辛,大多数古籍研究者都有所体会,而且网络上多是二字节的汉字。这个检索引擎所采用的四字节自然语言检索技术,具有切词、分词功能。例如:计算机可以识别“低头思故乡”或“故乡思低头”,也就是说只要在短语或句子中出现有实际意义的词组,就可以出现所有包括这些词组的短语或句子,当然也包括了那些生僻字或者古字等。
《说文解字》现代版及数据库能实现简、繁体自动转换,这样在保证古籍研究者需要的同时也满足了中青年读者的需要。许多研究人员向来对简体的所谓“古籍”颇为担虑,除了价值的大打折扣甚至荡然无存之外,通常将原简体稿件恢复为繁体时,使得复核工作繁琐不堪,降低效率。进一步说来,古籍的整理和研究还有版本学的范畴,不同的版本蕴涵了不同的文字信息,这是简体版所不能比拟的。同时《说文解字》数据库的内容完全按照字典图书的出版要求将差错率控制在1/10000以内,同时配合纸本图书同步出版,满足不同读者的使用需求。《说文解字》数据库网络版本的发布更是解决了中国古籍在全球通用浏览器上进行阅读和编辑的难题,对中国古典文化的传播起到了极大的推动作用。
技术只有具有真正的使用价值,才能够被赋予长久的生命力。《说文解字》数据库系统的技术无疑是先进和实用的。据悉,《说文解字》数据库及网络版所采用的四字节处理技术和检索引擎已经申请专利,出版方同时透露,同类的字书类图书及数据库产品──《康熙字典》的出版准备已经接近尾声。社科文献出版社将于2005年6月2日举行“《说文解字》图书及数据库演示发布暨古籍数字化研讨会”,届时,将发布演示《说文解字》图书及光盘数据库和基于互联网的网络型多字节汉字检索系统,同时中国社会科学院、科技部、新闻出版总署、国务院古籍办、国家图书馆、清华紫光等单位的专家、学者还将就古籍数字化整理进行专题研讨。相信以《说文解字》数据库为契点,中国古籍研究工作将会进入全新的、真正的数字化阶段。
COBRA 110度V型书托鹰眼式古籍专用扫描仪,是世界项级书刊扫描仪生产专家Book2net书刊扫描仪系列的贵族产品。
Cobra书刊扫描仪是扫描方式的扩展和延伸,其设计更能有效古籍最大限度的不受伤害,而呈现出高品质的扫描质量。
一、 目前市场对古籍扫描仪的需求:
(1)历史文献数字化对图书馆的服务而言变得越来越重要;
(2)进行数字化处理的文件需求越来越多;
(3)许多珍贵文献都是独一无二的,需要按照保存规则进行温和处理;
(4)为了更好地进行数字化文件处理,扫描设备需适用于进行数字化处理的任何文 件,而不是这些文件需要适合于扫描设备;
(5)最大限制地拉高扫描设备的效率,节约成本;
(6)单拍摄技术快速改进,目前有充分的理由在许多应用中取代线传感器设备;
(7)逼真彩色的色调复印、完美的图像品质已成为现实;
(8)许多书籍不允许开到180度角;
(9)书籍越旧平均损坏率越大。
二、book2net的背景及承诺
在以下领域MICROBOX作为与book2net合作的设备生产商,其内部技术实力雄师
(1)传感器技术;
(2)CCD单摄技术;
(3)CMOS单摄技术;
(4)不同语言形式的软件和平台;
(5)PCB板设计
(6)光学;
(7)力学与专门书刊固技。
book2net设计团队认真聆听来自许多主要图书馆已传达出的需求。
book2net团队已经听取了这些需求,并把它们转换成新产品。
三、Book2net COBRA型书刊扫描仪是从广泛的线传感器技术范围中精选出的、最适合的组件。
捕捉技术:两个4,000万像素或5,000万像素的区域传感器
高速捕捉:
扫描时间0.4秒
包括图像增强时间在内的循环周期时间为3.3秒
高分辨率
最佳信噪比
较低背景噪声和较高压缩因子
OCR识别系统使得工作更快、更好
LED照明与向后送纸控制
操作过程中恒温最有利于逼真彩色和色调的复制
长寿命
无紫外线和无红外线
旋转快门无需外部摩擦
寿命: 300 Mio. 循环周期
激光对中仪
…完美书刊定位和焦点定位
书托托架:规格和优势:
110°角V形托架- 可选择不同角度
扫描区域/介质大小: 2x A3+大到2 x A2+
所有书刊托架元素可调,书刊托架的配件选择:
书刊托架的水平运动(1)
…左垫和右垫(2)
书刊脊支撑调整(3)
书刊托架整体的垂直运动 (4)
传感器:
两个高性能矩阵式CCD传感器(鹰眼双体点对点扫描技术)
镜头:
Rodenstock Rodagon工业级别镜头
处理器:
旋转盘式处理器(寿命600,000,000次循环)
光学分辨率:
400dpi-800dpi
扫描时间:
2 X A3(A2)彩色/400dpi为0.3秒
处理时间:
扫描/成像为1.9秒(2 X A3彩色)
聚焦深度:
13cm/5inch
输入介质尺寸:
2 X 343mm X 458mm(〉A2)
书刊托架:
V型电动化布局工作台可以处理带脊达25CM和处理30KG的书本
玻璃稿台:
全自动V型高光学玻璃压稿台
光源:
低能冷光源技术,30CM*2双侧零紫外线补光板
PC接品:
USB2.0 B型/高达51 MB/sec增强传输模式
软件:
BookExpert专业图书扫描系统,包括:
自动页识别
自动页拆分
手动页选择与拆分
自动纠缠
旋转几个过滤器
更改分辨率
从彩色到灰色/从灰色到双色的转换
多种文件格式保存
打印
电源:100V到240V、带接地线
功耗:80VA
尺寸:高度:1900 mm,宽度:700mm,深度:860 mm
重量:50 kg
操作环境:搞倾斜、无振、水平面、无阳光直射
操盘:10度-38度,相对温度:15%-85%(无冷凝)