一、系统环境准备与基础配置
在开始档案录入前,必须确保系统环境正确配置。以下步骤缺一不可。
1.1 服务器环境检查
登录数字档案馆系统服务器,执行以下命令检查核心服务状态:
```
检查Java环境(假设系统基于Java)
java -version
检查数据库服务(以PostgreSQL为例)
sudo systemctl status postgresql-13
检查Tomcat服务
sudo systemctl status tomcat9
```
如果任何服务未运行,使用sudo systemctl start [服务名]启动。确保防火墙开放了应用端口(默认8080):
```
sudo firewall-cmd --permanent --add-port=8080/tcp
sudo firewall-cmd --reload
```
1.2 系统管理后台初始化配置
通过浏览器访问系统管理后台(通常为http://服务器IP:8080/admin),首次登录后,按顺序完成:
- 元数据方案配置:进入“元数据管理”->“方案管理”,点击“导入”。从系统安装包的`/conf/metadata/`目录选择`standard_archive_profile.xml`文件导入。这是档案著录的核心模板。
- 存储路径设置:进入“系统设置”->“存储管理”,设置数字化文件的存放根目录。例如:/data/digital_archive/。确保该目录权限正确:
sudo chown -R tomcat:tomcat /data/digital_archive。
- 用户与角色创建:为档案录入人员创建专属账号。进入“用户管理”,点击“新建”,填写用户名(如`archivist_01`)、真实姓名,角色选择“档案录入员”。权限组务必勾选“档案上传”、“元数据编辑”、“临时库管理”。
二、档案数字化预处理规范
纸质档案在录入系统前,必须完成标准化数字化处理。
2.1 文件命名规则
扫描或生成的电子文件必须遵循以下命名格式:
[档号]_[序号].[文件格式]
例如:Z034-2023-001_001.pdf。档号与实体档案一致,序号从001开始递增,对应页码或文件顺序。禁止使用中文、空格及特殊字符(除下划线和连字符)。
2.2 文件格式与质量标准
- 文本类档案:永久保存格式为PDF/A,扫描分辨率不低于300dpi,颜色模式为黑白或灰度。
- 照片类档案:永久保存格式为TIFF或无损JPEG2000,分辨率不低于600dpi,颜色模式为RGB。
- 文件大小控制:单个PDF文件建议不超过50MB,TIFF文件不超过200MB。过大文件应使用专业工具(如Adobe Acrobat)进行优化或分拆。
使用以下命令批量检查扫描件质量(需安装ImageMagick):
```
检查目录下所有TIFF文件的分辨率
identify -format "%f: %x x %y\n" /path/to/scans/.tiff
```
三、核心录入流程分步详解
3.1 创建档案目录(案卷/件)
登录档案员账号,进入“档案管理”->“目录管理”。
- 点击“新建案卷”,在弹出表单中填写:档号(如Z034-2023-001)、题名、起始日期、终止日期、保管期限(永久/30年/10年)。
- 点击“保存”,系统自动生成一个案卷级节点。
- 选中该案卷,点击“新建文件”,为案卷内的每一份独立文件创建件级目录。每件必须填写件号(如001)、文件题名、页数。
3.2 元数据著录
点击任一文件目录的“著录”按钮,进入元数据表单。这是决定档案检索效率的关键。
根据导入的元数据方案,表单包含必填项和选填项。以下为必须完整填写的核心字段:
- 题名:准确反映文件内容,结构为“关于+事由+文种”,如“关于2023年度财务决算的通知”。
- 责任者:文件的形成单位或个人,多个责任者用分号隔开。
- 日期:文件形成的发文日期或签署日期,格式必须为YYYY-MM-DD。
- 文号:文件发文字号,如“财办〔2023〕15号”,严格按原格式录入。
- 关键词:从文件内容提取3-5个主题词,用于全文检索,词与词之间用英文逗号分隔。
填写完毕后,务必点击“保存并继续”,不要直接关闭页面。
3.3 电子文件挂接

在著录保存后的页面,找到“电子文件”区域。
- 点击“上传”,选择预处理好的、命名规范的数字文件(如`Z034-2023-001_001.pdf`)。
- 系统上传后,在“文件关系”下拉菜单中,选择“正文”。如果是附件,则选择“附件”。
- 点击“关联”,完成文件与目录条目的绑定。页面会显示文件缩略图及MD5校验码,请核对。
批量挂接技巧:对于已上传至存储目录的文件,可使用“快速关联”功能。在“电子文件”区点击“本地关联”,输入文件在服务器上的绝对路径(如`/data/digital_archive/Z034-2023-001/`),系统将自动匹配并关联同名文件。
四、质量检查与入库流程
4.1 录入完整性自检
在“我的工作台”->“待办事项”中,找到“待检查条目”列表。逐条点击进入,执行以下检查:
- 检查元数据:重点核对档号、题名、日期、页数是否与实体档案完全一致。
- 检查电子文件:点击文件预览,确保文件内容清晰、完整、方向正确、无漏页。
- 检查关联关系:确保每一“件”档案都正确关联了对应的数字文件。
发现问题时,直接在当前页面修改并保存。无需退回重走流程。
4.2 提交审核与正式入库
自检无误后,在目录管理页面,勾选已完成的案卷或文件。
- 点击顶部“提交审核”按钮,选择审核角色(如“档案审核员”)。
- 填写提交意见,简要说明录入情况,如“2023年度财务卷,共10件,已全部录入完成”。
- 点击“确定”,条目状态变为“待审核”,并从你的工作列表中消失。
审核员通过后,档案会自动从“临时库”转入“正式库”,完成归档。你可以在“档案查询”模块,使用档号或题名检索到已入库的档案,表示录入流程全部结束。
五、常见问题与排错
以下是在录入过程中必然遇到的具体问题及解决方法。
5.1 文件上传失败
错误信息:“文件上传服务异常”。
解决步骤:
- 检查服务器磁盘空间:
df -h /data。使用率超过90%需清理。
- 检查Tomcat上传大小限制:编辑`/usr/local/tomcat/conf/web.xml`,找到`max-file-size`和`max-request-size`参数,确保值足够大(如设置为500MB)。
- 重启Tomcat服务:
sudo systemctl restart tomcat9。
5.2 元数据保存报错
错误信息:“字段‘XX’校验失败”。
解决步骤:
- 返回表单,检查报错字段的格式。日期字段必须为YYYY-MM-DD,数字字段不能包含中文。
- 如果字段内容本身正确,可能是字段长度超限。在管理后台的“元数据管理”中,找到对应字段,修改其“最大长度”属性,然后清空浏览器缓存重试。
5.3 检索不到已录入档案
在“档案查询”中搜索不到刚提交的档案。
解决步骤:
- 确认档案状态是否为“已入库”。在“目录管理”中,筛选状态查看。
- 检查检索条件:刚入库的档案,全文索引可能有延迟。等待5-10分钟后,使用精确档号检索。
- 若仍无效,手动重建索引。在管理后台“系统维护”->“索引管理”中,点击“全量重建索引”。此操作耗时较长,请在非工作时间进行。