一、前置准备工作
1.1 明确合规要求
国内档案行业协会统一的档案数字化核心合规要求如下,所有操作都需满足以下条款:
- 完整性要求:不得缺页漏页,档案原顺序不得错乱
- 格式要求:长期保存需采用PDF/A-2b格式,分辨率不低于300DPI
- 著录要求:必须包含档号、题名、年度、保管期限四个核心必填字段
- 存储要求:需完成三份异地异质备份,满足长期保存要求
- 质量要求:OCR识别准确率不低于95%,每页内容清晰无缺损
1.2 免费工具准备
所有工具均为公开免费,无需付费可直接使用,具体如下:
- 扫描工具:支持300DPI输出的办公扫描仪,若无专用设备可使用微信内置「腾讯文档扫描」小程序,无需额外下载安装
- PDF处理工具:WPS免费版即可满足OCR识别、合并PDF需求,直接从官网https://www.wps.cn/下载安装
- PDF/A格式转换工具:免费在线转换地址:https://www.ilovepdf.com/zh-cn/convert_pdf_to_pdfa,无需登录即可使用
- 著录工具:Excel或WPS表格免费版均可
二、前期档案整理(协会要求必做步骤)
多数加工不合格的案例都是跳过这一步,按照以下流程操作即可:
- 第一步:原件整理:去除档案中的所有金属物(订书钉、回形针、夹子等),避免划伤扫描设备;对破损纸张做简单手工修补,大幅面纸张铺平,将卷内档案按照原顺序排列,检查核对页数,若存在缺页,需在备注栏注明缺页位置、原因,不得私自补页。
- 第二步:建立著录表格:打开空白表格,直接复制以下表头到第一行即可使用:
```
档号,题名,年度,保管期限,页数,备注
```
每一卷档案对应一行记录,如实填写所有字段信息即可。
三、数字化加工实操步骤
3.1 扫描操作
按照以下参数设置扫描,一步符合协会分辨率要求:
- 专用扫描仪:设置参数为分辨率300DPI,彩色档案用24位真彩色,灰度档案用16位灰度,单页导出为JPG格式,文件名统一命名规则为「档号-三位页号」,例如:2023-XZ-001-001,方便后续排序。
- 手机小程序扫描:打开「腾讯文档扫描」,进入设置将输出分辨率调整为300DPI,扫描单页后导出为JPG,命名规则和扫描仪一致即可;大幅面档案分块扫描后,在WPS中拼接为完整一页即可。
3.2 合并、识别与格式转换
- 1. 将同一卷档案的所有扫描JPG按照文件名排序,批量导入WPS,合并为单个PDF文件。
- 2. 在WPS中点击「特色应用」-「OCR识别」-「识别当前文档所有页面」,识别完成后保存带可检索文字的PDF版本。
- 3. 打开上文给出的PDF/A转换工具,上传生成的可检索PDF,选择转换为PDF/A-2b格式,下载转换后的文件,命名为「对应档号.pdf」,即得到符合协会要求的最终数字化文件。
四、协会标准质量校验流程

必须完成三轮校验,全部合格才能进入归档环节:
- 第一轮:完整性校验:对照著录表格中的页数,核对PDF总页数,一致即为合格;逐页检查PDF内容,没有歪斜、黑边、缺字、反光遮挡即为合格,不合格页重新扫描。
- 第二轮:合规性校验:检查PDF格式是否为PDF/A-2b,打开文件后在属性中即可查看格式信息,不对重新转换;抽查OCR识别准确率,随机选3页,错字率不超过5%即为合格,低于标准重新识别。
- 第三轮:一致性校验:核对PDF文件名和著录表格中的档号,确保一一对应,没有错配,批量加工按照10%比例抽检,10卷以内全检。
五、归档存储落地
按照档案行业协会要求,完成三级备份即可:
- 第一份:在线工作备份,存放在单位内部专用档案服务器/本地硬盘,设置文件为只读权限,防止误改误删。
- 第二份:异地备份,存放在距离本地站点不少于50公里的异址存储设备,推荐使用蓝光光盘作为存储介质,满足30年以上长期保存要求。
- 第三份:离线冷备份,将所有数据拷贝到专用加密移动硬盘,存放在防潮防火的专用档案柜中,定期每三年检测一次数据完整性。
最后按照协会要求生成加工报告,可直接复制以下模板使用:
```
档案数字化加工合规报告
加工批次:[填写批次编号]
加工总量:共XX卷,XX页
合格情况:合格XX卷,不合格XX卷,不合格说明:[填写原因]
备份位置:1.本地备份:[位置] 2.异地备份:[位置] 3.离线备份:[位置]
加工负责人:[姓名] 加工日期:[YYYY年MM月DD日]
```
将加工报告和著录表格一起归档后,整个符合档案行业协会规范的档案数字化加工就全部完成,可直接交付或入库保存。