1 档案扫描
1.1 扫描方式
根据档案幅面的大小(A4、A3、A0等)和纸张质量选择相应规格的扫描仪进行扫描。数量较少的大幅面档案,可采用小幅面扫描后的图像拼接方式处理;如果数量较多则使用宽幅工程扫描仪进行扫描。纸张状况较差,以及过薄、过软或超厚的档案,或者不宜拆装的档案,应采用平板扫描方式。纸张状况好并且可以拆装的档案,可采用高速扫描方式以提高工作效率。
1.2 扫描色彩模式
扫描色彩模式一般有黑白二值、灰度、彩色等,通常采用黑白二值。页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。页面中插有黑白照片、彩色照片、彩色插图、印章等带色彩标志的档案,可视需要采用彩色模式进行扫描。底图可视需要采用灰度或彩色模式进行扫描。
如需要进行OCR识别的,应采用黑白二值扫描。
1.3 扫描分辨率
采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率应≥200DPI。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。如需要进行OCR识别的,扫描分辨率应≥300DPI。
1.4 扫描登记
认真填写档案扫描情况登记表单,登记扫描的页数,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法。
2 图像处理
2.1 对扫描图像偏斜度、清晰度、失真度、完整情况等进行检查,发现问题及时处理或重新扫描。
3.3.2.2 发现文件漏扫、扫描图像排列顺序有误时,应及时补扫并正确插入图像,调整排列顺序。
2.3 对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
2.4 对扫描图像中影响图像质量的杂质(黑点、黑线)、多余边框等,进行去污和裁边处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
2.5 对大幅面档案分区扫描形成的多幅图像,进行拼接处理,合并为一个完整的图像。
2.6 认真填写图像处理情况表单,记录质检结果和处理意见。
3 图像存储
3.1 长期保存格式
采用黑白二值模式扫描的图像文件,使用TIFF(G4)格式存储。采用灰度模式和彩色模式扫描的文件,使用JPEG格式存储。如需要进行OCR识别的,识别后可存储为双层PDF格式。
3.2 网络利用格式
不需要进行DRM保护的扫描图像,可直接以TIFF、JPEG、PDF格式在网上提供利用。
需要进行DRM保护的扫描图像,可由集团公司档案管理系统批量转换为XPS格式后再行发布。
3.3 存储方式和命名规则
按“档号”建立文件夹方式存储。
以档案数据库中每份文件的档号,命名该份文件的图像存储文件夹;以每份文件的题名,命名该图像存储文件夹下所保存的扫描图像文件。通过档号的一致性和唯一性,建立起档案数据库条目与图像存储文件夹一一对应的关联关系,从而确保扫描图像文件挂接的正确。