古籍翻印,我们想要的究竟是什么? 什么叫“‘字库级’古籍翻印”?   古籍刻本的字库级翻印  字库级古籍翻印的优点  让现代科技为中国传统文化服务  字库影印无需打字,清晰度超影印,原理  古籍字库级翻印优于影印技术详解  当代古籍翻印技术  已有影印,为何还要搞“字库级翻印”?

 

字库级古籍翻印无须打字的技术奥秘

   字库级翻印,既然用了ttf字库技术手段,却无需打字(校勘修改除外),什么道理?。一般讲,调用字库,总得打字才行,至少得copy打好字的文本。然而,现在字库级翻印却无须打字,实现的原理是什么?
   从原理上说,任何信息(无论保存还是传播),作为文本,都是线性的、一维的。与此同时,任何顺序阅读,从头到尾,按常理,也是线性的、一维的。
   将上述原理应用到本课题:
   计算机字库Unicode编码顺序(最通用,制作字库时最方便)也是线性的、一维的。当然,对此你也可以用自己的字顺,甚至自编一个顺序(=任意顺序)并认定它是自己使用的线性一维。
   任何图书,其具体内容也有一个自己的顺序。当然,这个顺序也是线性的、一维的。
   上述几个顺序中本课题用到的是字库顺序和书籍含义顺序。将这两个顺序叠合到一起,这种叠合对于一般的含义表达来说没有任何意义,但是从制作字库翻印古籍角度来看,你就会发现,这个按照Unicode字顺显示的字符图像集合,就是这本书的实际内容,两者自然叠合。所以说,如果按照Unicode编码顺序序列化地将古籍中的字符扫进ttf,做成字库,然后再按照Unicode顺序将字符排版,那么你将得到与原著一模一样的文本实际体现(当然不是Unicode原本表达的含义),无须校对。但是,当然,这种技术的实现过程和翻拍不一样,出错的方式也不一样。翻拍不好的结果是字迹模糊,而字库做不认真,则是丢字拉字。
   举例来说,Unicode字顺是:“一”(4e00)、“丁”(4e01)、“七”(4e02)、“万”(4e03)、“丈”(4e04)、“三”(4e05)。注意,这里的这些16进制数只是双字节字的Unicode的编码位置。在这些编码位置上并无字符图像,而如果你把一句唐诗(“东明九芝盖”)的字符图像顺序置于其上,再选用这个字库时,你就会发现,“一丁七万丈三”顺序的打字也好,粘贴也罢,显示出的字符图像恰好就是这句唐诗。大家都搞印制,无论Unicode编码原字符含义如何,都不可能直接印在纸上,印在纸上的只能是在这些编码上的实际字符图像,那么,尽管你使用的是“一丁七万丈三”的含义编码,但实际显示的字符图像却是“东明九芝盖”,印出来的当然也是“东明九芝盖”,将来的出品自然还是“东明九芝盖”,与原通用字顺的含义“一丁七万丈三”毫无关系。
   这实际上说明了一个问题,无论我们采用什么编码、什么含义,我们最终看到的是印出来的字符图像。如果我们勇于牺牲掉字符含义的通用性,转置为字符图像的多样性,对于印品本身来说无伤大雅,只是电子文本失去了以前通常具备的意义,但是这种意义对于印品制作来说没什么大用。如果需要原文文本电子版含义,另备一份即可。此时此地不需要其电子版的文本含义,而是需要字符应用的艺术性,那么,我们就完全应该“甩开含义上书法”。
   做字库时,需要一个给定的编码顺序,如果使用某种工具软件,可以给出任意顺序。那么,如果根据你扫描原书内容进入字库,再按照Unicode字顺给出通用含义的文字,该书内容即刻呈现出来。这完全与本技术相契合,或者说,本技术就是利用了这种可以建立的关联关系,从而达到用同一个ttf字库容纳无数个多重复字。
   字库级古籍翻印利用自编码,不需要一般正常打字输入。其技术过程设计为:直接打开某固定字顺,原文码位上的字符图像就会像原文文本一样呈现出来。实际上这只是“图像契合”,与含义无关。
   简单地说,你制作ttf字库的时候,需要按照一个字顺,将制作的汉字字符顺序输入到ttf之中。由于文本含义线性一维,当两个线性过程相互叠加,结果必然是造字顺序的连续文本字符图像。两个线性顺序的叠影,这是本技术的关键。
   我们习惯了用正常的编码输入,对非标状态的文本表现不理解。实际上,正常的文本是一种大家公认的信息传播模式,大家使用同一模式才可能达成统一的信息交流,无论是字库,输入法,打字,copy粘贴等等,都只适用于信息交流模式。但是如果不用于信息交流,譬如只是为了更好地进行古籍翻印,不必关心含义正确与否,那么很显然,屏幕上显示了什么才最重要。本技术就是利用了字顺固定,而标准码位字符所对应的图像可不固定(可变)的自编码技术,让ttf得以顺利容纳同一字符的多个微差的重复样,实现了对汉字书法的支持。重复字是中文古籍中必不可少的表达状态。没有重复字,古籍中书法状态的雕版字就无从表现了。
   字库扫描程序通过扫描图像,顺序导入码位所有可分割字符(当然包括重复字)。码位是顺序的,因此,只要给出顺序码位编码的字符,再适用于造好的字库,就可以顺利表现古籍的页面,而且将这个页面的艺术性含义转化为了线性一维连续状态。也就是说,你可以利用这种线性一维连续的逻辑状态再次构造(重新排版),形成新的字符页面格式。
   既然已经可以进行新排版,那么显然更新内容,利用该ttf字库重排新文档也都不在话下。当然,具体应用的操作过程还需要一些相关技术细节,不过书法状态可以重新进入排印状态已经成为不争的事实。