在开始部署之前,必须确保操作系统中已经安装了 Docker 环境。Docker 能够将应用及其依赖打包,实现“一次构建,到处运行”,这符合绿色软件不污染系统注册表、易于卸载的特性。
1. 下载并安装 Docker Desktop
对于 Windows 用户,直接访问 Docker 官方下载页面获取安装包。请务必下载最新稳定版以确保兼容性。
下载地址:https://www.docker.com/products/docker-desktop/
下载完成后,双击运行 Docker Desktop Installer.exe。安装过程中保持默认选项勾选,勾选 "Use WSL 2 instead of Hyper-V"(推荐),这能显著提升性能。安装完成后重启电脑,任务栏出现鲸鱼图标即表示服务已启动。
2. 验证 Docker 环境
打开终端(PowerShell 或 CMD),输入以下命令检查版本:
```bash docker --version docker-compose --version ```如果能够输出版本号(例如 Docker version 24.x.x),说明环境准备就绪。如果报错,请确保 Docker Desktop 已经完全启动。
为了保持系统整洁,我们在 D 盘根目录下创建一个专门的文件夹来存放档案系统的数据和配置文件。这种“绿色”的目录隔离方式,卸载时只需删除该文件夹即可。
1. 创建目录
在文件管理器中进入 D:\,新建文件夹命名为 paperless-ngx。在该文件夹内,新建以下两个子文件夹:
data:用于存放数据库文件和索引数据。media:用于存放上传的原始文档、生成的 PDF 及缩略图。2. 准备配置文件
在 D:\paperless-ngx 根目录下,新建一个文本文件,将其重命名为 docker-compose.yml。这是整个系统的核心编排文件。
打开 docker-compose.yml,复制以下完整内容并保存。该配置经过优化,专门针对单机版环境,集成了数据库、缓存、Web 服务及文档处理服务。
注意:上述配置引用了一个环境变量文件 docker-compose.env。请在同目录下新建该文件,并填入以下关键配置,以启用中文 OCR 识别功能:
这里指定了 OCR 语言为简体中文加英文,时区设置为亚洲上海,确保文档处理时间和识别语言符合国内使用习惯。
配置文件准备完毕后,即可启动服务。
1. 拉取镜像并启动容器
在 D:\paperless-ngx 目录下打开终端,执行以下命令:
系统会自动从 GitHub Container Registry 拉取所需的镜像(约 1GB+),首次运行需要较长时间,请保持网络通畅。看到 Started 或 Done 提示即表示启动成功。
2. 创建超级管理员账户
容器启动后,需要创建一个登录账号。执行以下命令:
```bash docker compose exec webserver createsuperuser ```
按照提示输入用户名(例如 admin)、邮箱和密码。密码输入时屏幕不会显示,这是正常的安全机制。
1. 访问系统
打开浏览器,访问 http://localhost:8000。使用刚才创建的超级管理员账户登录。
2. 配置文档处理流程
登录后,点击右上角 Settings -> Settings -> Document processing。
chi_sim+eng。3. 导入档案文档
点击左侧菜单的 Documents -> Add documents。直接拖拽本地的图片、PDF 或 Word 文档到上传区域。
4. 绿色环保的“消费”文件夹功能
为了实现更高效的批量归档,可以使用配置文件中映射的 consume 文件夹。
在 D:\paperless-ngx 下新建 consume 文件夹。你可以将扫描仪直接设置为输出到该文件夹,或者将大量待处理文件直接复制进去。系统会每隔 30 秒(由配置文件中 PAPERLESS_CONSUMER_POLLING 控制)自动扫描该文件夹,处理完成后会自动删除原文件,保持目录整洁。
作为单机版档案系统,数据安全完全取决于本地备份。以下是完整的备份与恢复步骤,确保数据万无一失。
1. 数据备份
由于使用了 Docker 卷映射,所有核心数据都存储在 D:\paperless-ngx 目录下。备份操作极其简单:
docker compose stopD:\paperless-ngx 整个文件夹为 paperless_backup_日期.zip。docker compose start2. 灾难恢复
当系统崩溃或更换电脑时,只需:
D:\。docker compose up -d。所有文档、标签、用户权限将瞬间恢复,完美体现了绿色软件便携、可迁移的优势。
1. OCR 识别速度慢或报错
Paperless-ngx 依赖 tesseract 进行 OCR。如果发现文档一直处于“Processing”状态,通常是内存不足。建议给 Docker Desktop 分配至少 4GB 内存(Settings -> Resources -> Memory)。
2. 无法访问 localhost:8000
检查 Windows 防火墙是否拦截了 Docker 的通信,或者检查 8000 端口是否被其他程序占用。可以使用命令 netstat -ano | findstr :8000 查看端口占用情况。
3. 中文显示乱码
确保 docker-compose.env 中 PAPERLESS_OCR_LANGUAGE 设置正确。如果生成预览图乱码,可能需要在宿主机安装对应的中文字体,或者重新拉取包含完整字库的镜像。