所需工具共2款,均无需付费即可使用:
第一款是得力扫描助手,官方下载地址:https://www.deli.com/cn/service-support/download-center/scan-software,适配所有主流扫描仪,无需额外安装驱动。
第二款是开源档案管理系统DocManageSys,直接用Docker一键部署,执行命令:
docker run -d -p 8080:80 -v /local/archive:/var/www/html/archive docmanagesys/docmanagesys:latest
部署完成后访问http://你的服务器IP:8080即可进入系统,默认账号admin,默认密码123456,登录后第一时间修改密码。
先把所有待归档的纸质法律文书的订书钉、回形针、燕尾夹全部拆除,破损页用透明胶带在背面粘贴平整,褶皱页用重物压平后再处理。提前按文书属性做初步分拣:
统一采用「年份-案件类型-主体归属」三级分类规则,示例路径:2024年/民事诉讼类/张三民间借贷纠纷案。每类案件下的文书按时间先后顺序排列,首页固定放生效证明/送达回证,末尾放结案相关材料。
给每份文书分配唯一识别编码,编码规则为【2位年份码+2位类型码+4位顺序号】,类型码对应规则:MS=民事诉讼,XS=刑事诉讼,XZ=行政诉讼,FS=非诉业务,GL=内部管理。示例:24MS0012代表2024年民事诉讼类第12份文书,编码贴纸贴在纸质文书右上角,和电子档案一一对应。
扫描参数统一配置:分辨率300DPI,普通文书用黑白二值模式,带签字/公章的页面用24位彩色模式,单份文书导出为1个PDF文件,扫描后检查是否有缺页、歪页、漏扫,确认无误后命名为【编码+文书全称】,示例:24MS0012_张三民间借贷纠纷案一审民事判决书.pdf。
扫描完成后做OCR文字识别,用百度开源的PaddleOCR,执行以下命令即可完成安装与识别: ``` 安装依赖 pip install paddlepaddle==2.5.2 paddleocr==2.7.3 执行识别 paddleocr --image_dir 扫描文件路径 --use_angle_cls true --lang ch --output ./ocr_result ```

识别完成后逐份核对核心信息:案号、当事人姓名/主体名称、判决主文/合同核心条款、日期,识别错误的内容手动修正,确保电子档案文字100%准确。
存储采用「本地NAS+政务云对象存储」双备份机制,本地NAS存储路径和之前的三级分类完全对应,政务云备份每天凌晨2点自动同步,仅同步增量文件,避免重复占用存储空间。
打开DocManageSys系统后台,找到config/config.yaml文件,替换为以下完整可直接复用的配置: ```yaml 法律文书档案系统配置 system: name: 法律文书档案库 max_upload_size: 100 单文件最大100M expire_remind: true 到期自动提醒 search: enable_full_text: true index_fields: ["文书编码", "案号", "当事人", "文书类型", "日期"] permission_check: true export_limit: 10 单次最多导出10份 permission: roles: admin: ["add", "delete", "edit", "view", "export", "config"] lawyer: ["view_own", "export_own"] staff: ["add"] guest: [] ```
配置保存后执行docker restart docmanagesys重启系统生效,按人员角色分配对应账号即可。
扫描件模糊:重新扫描时将纸张压平对齐扫描仪标线,老旧破损文书可使用PS的USM锐化工具,参数设为数量150%、半径1像素、阈值2,即可大幅提升文字清晰度。
检索不到对应文书:进入系统后台执行php think index:rebuild重建全文索引,若仍检索不到,检查OCR识别结果是否有错别字,手动修正后重新索引即可。
档案损坏丢失:优先从NAS的每日快照恢复,快照默认保留30天,NAS故障时从政务云备份恢复,正常情况下不会出现档案丢失问题。
每季度做1次纸质档案与电子档案的100%对账校验,确保两份档案内容、数量完全一致。涉及国家秘密、个人隐私、商业秘密的文书采用AES-256加密存储,密钥由管理员和机构负责人各持50%,合并后才可解密查看。
档案保存期限:诉讼类档案保存30年,非诉类档案保存15年,内部管理类档案保存10年,到期后需两名以上工作人员在场监销,留存销毁记录至少5年,不得私自销毁档案。