orc-order-v2/doc/USER_MANUAL.md
2025-11-15 18:46:03 +08:00

477 lines
14 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 益选-OCR订单处理系统 - 用户操作手册
## 界面功能介绍
### 主界面布局
#### 启动界面
系统启动时会显示一个简洁的启动界面,包含:
- **系统标题**:益选-OCR订单处理系统
- **版本信息**:显示当前系统版本
- **加载进度**:显示系统初始化进度
#### 主操作界面
主界面采用现代化设计风格,包含以下主要区域:
##### 顶部工具栏
- **系统标题**:显示在界面顶部中央
- **主题切换**:支持浅色/深色主题切换
- **帮助按钮**:访问用户手册和系统信息
##### 功能按钮区域
- **OCR识别按钮**:启动图片识别功能
- **Excel处理按钮**处理OCR识别结果
- **采购单合并按钮**:合并多个采购单
- **完整流程按钮**:执行完整的处理流程
- **配置管理按钮**:打开系统配置界面
##### 状态栏
- **状态显示**:显示当前系统状态(就绪/处理中/完成)
- **进度条**:显示处理进度百分比
- **时间信息**:显示处理开始时间和耗时
##### 日志显示区域
- **实时日志**:显示处理过程的详细日志
- **颜色标识**:不同级别的日志使用不同颜色
- **滚动支持**:支持日志内容的滚动查看
- **清空功能**:可以清空当前日志内容
### 功能界面详解
#### OCR识别界面
当点击OCR识别按钮时系统会
1. 自动扫描`data/input`目录中的图片文件
2. 显示找到的图片文件数量
3. 开始批量OCR识别处理
4. 实时显示处理进度和结果
#### Excel处理界面
处理OCR结果时系统会
1. 读取OCR生成的Excel文件
2. 提取商品信息(条码、名称、规格、数量、单价)
3. 应用数据清洗和标准化规则
4. 生成标准格式的采购单
#### 采购单合并界面
合并功能界面提供:
1. 选择要合并的采购单文件
2. 显示合并进度和状态
3. 展示合并结果摘要
4. 提供合并后文件的快速访问
#### 配置管理界面
配置界面包含:
1. **基本设置**:输入输出目录配置
2. **API配置**百度OCR API密钥设置
3. **性能设置**:批量处理参数配置
4. **高级设置**:其他高级参数配置
## 详细操作步骤
### 首次使用设置
#### 1. 系统安装和配置
**步骤1.1**:确保系统环境满足要求
- 操作系统Windows 7/8/10/11LinuxmacOS
- Python版本3.8或更高版本(如使用源码)
**步骤1.2**获取百度OCR API密钥
1. 访问百度智能云官网https://cloud.baidu.com/
2. 注册并登录账号
3. 进入"文字识别"服务
4. 创建应用获取API Key和Secret Key
5. 记录这两个密钥,后续配置需要使用
**步骤1.3**:配置系统参数
1. 打开`config.ini`文件
2. 在`[API]`部分填入获取的密钥:
```ini
[API]
api_key = 你的API密钥
secret_key = 你的Secret密钥
timeout = 30
max_retries = 3
retry_delay = 2
```
3. 配置输入输出路径:
```ini
[Paths]
input_folder = data/input
output_folder = data/output
temp_folder = data/temp
```
#### 2. 准备图片文件
**步骤2.1**:创建图片文件夹
在系统目录下确保存在以下文件夹:
- `data/input/` - 存放待处理的采购单图片
- `data/output/` - 存放处理结果
**步骤2.2**:图片质量要求
- **分辨率**建议300DPI或更高
- **格式**支持JPG、JPEG、PNG、BMP格式
- **大小**单张图片不超过4MB
- **清晰度**:文字清晰,无模糊、反光
**步骤2.3**:图片命名规范
- 使用有意义的文件名,如"采购单_20250101.jpg"
- 避免使用特殊字符和空格
- 建议使用日期和序号进行命名
### 基本操作流程
#### 单张图片处理流程
**步骤1**:启动系统
1. 双击`OCR订单处理系统.exe`或在命令行运行`python 启动器.py`
2. 等待系统初始化完成(状态栏显示"就绪"
**步骤2**:放置图片文件
1. 将采购单图片文件复制到`data/input/`目录
2. 确保图片格式正确,质量良好
**步骤3**执行OCR识别
1. 点击"OCR识别"按钮
2. 系统会自动扫描输入目录
3. 在日志区域查看处理进度
4. 等待识别完成
**步骤4**处理Excel结果
1. 点击"Excel处理"按钮
2. 系统会读取OCR生成的Excel文件
3. 提取商品信息并标准化
4. 生成标准采购单格式
**步骤5**:查看处理结果
1. 处理完成后,点击"打开输出目录"
2. 查看生成的Excel采购单文件
3. 核对商品信息是否正确
#### 批量处理流程
**步骤1**:准备多张图片
1. 将多个采购单图片放入`data/input/`目录
2. 确保所有图片都符合质量要求
**步骤2**:执行完整流程
1. 点击"完整流程"按钮
2. 系统会依次执行:
- OCR识别所有图片
- 处理所有Excel文件
- 合并相同商品
3. 查看批量处理结果
**步骤3**:监控处理进度
1. 观察状态栏的进度条
2. 查看日志区域的详细信息
3. 如有错误,查看错误信息并处理
### 高级功能使用
#### 条码映射配置
**步骤1**:打开条码映射文件
1. 编辑`config/barcode_mappings.json`文件
2. 按照JSON格式添加映射规则
**步骤2**:配置映射规则
```json
{
"原条码1": "目标条码1",
"原条码2": "目标条码2",
"6901234567890": "新条码123456"
}
```
**步骤3**:应用映射规则
1. 系统在处理时会自动应用映射
2. 原条码会被替换为目标条码
3. 适用于不同系统的条码适配
#### 自定义模板使用
**步骤1**:准备模板文件
1. 在`templates/`目录放置Excel模板
2. 模板应包含标准的采购单格式
**步骤2**:配置模板
1. 在`config.ini`中配置模板:
```ini
[Templates]
purchase_order = 银豹-采购单模板.xls
```
**步骤3**:使用模板
1. 系统生成采购单时会使用指定模板
2. 确保模板格式与系统要求匹配
#### 性能调优
**步骤1**:调整批量处理参数
在`config.ini`中配置:
```ini
[Performance]
max_workers = 4 # 最大工作线程数
batch_size = 5 # 每批处理文件数
skip_existing = true # 跳过已处理文件
```
**步骤2**:优化处理策略
- 根据电脑性能调整线程数
- 大批量处理时适当增加批大小
- 启用跳过已处理文件以提高效率
**步骤3**:监控资源使用
- 观察CPU和内存使用情况
- 根据系统资源调整参数
- 避免设置过高的并发数
## 常见问题解答
### Q1: 系统无法启动怎么办?
**A1**:
1. 检查Python环境是否正确安装源码版本
2. 确认所有依赖库已安装:`pip install -r requirements.txt`
3. 检查是否有足够的系统权限
4. 查看错误日志获取详细信息
### Q2: OCR识别失败如何处理
**A2**:
1. 检查图片质量是否满足要求
2. 确认图片格式是否支持
3. 验证百度OCR API密钥是否正确
4. 检查网络连接是否正常
5. 尝试降低图片分辨率或压缩图片大小
### Q3: 识别结果不准确怎么办?
**A3**:
1. 提高图片扫描分辨率
2. 确保图片光线充足,无反光
3. 检查采购单格式是否规范
4. 手动校正重要的商品信息
5. 考虑使用更高质量的扫描设备
### Q4: 批量处理时系统卡顿?
**A4**:
1. 降低批量处理的并发线程数
2. 减小每批处理的文件数量
3. 关闭其他占用资源的程序
4. 增加系统内存或使用更高配置的电脑
### Q5: 生成的Excel文件打不开
**A5**:
1. 确认已安装Excel或兼容软件
2. 检查文件是否完整生成
3. 验证文件路径是否正确
4. 尝试使用不同版本的Excel打开
5. 检查是否有足够的磁盘空间
### Q6: 条码映射不生效?
**A6**:
1. 检查JSON文件格式是否正确
2. 确认条码映射文件路径正确
3. 验证原条码和目标条码格式
4. 重启系统使配置生效
5. 检查日志中是否有映射相关的错误信息
### Q7: 处理速度很慢怎么办?
**A7**:
1. 优化网络连接,使用稳定的网络
2. 调整批量处理参数
3. 使用本地缓存减少API调用
4. 考虑使用更高性能的硬件
5. 分批处理大量文件,避免一次性处理过多
### Q8: 系统显示"未找到可合并的文件"
**A8**:
1. 确认输出目录中有Excel文件
2. 检查文件格式是否符合要求
3. 验证文件是否包含有效的商品数据
4. 确保文件没有被其他程序锁定
## 故障排除指南
### 系统启动问题
#### 症状:双击程序无反应
**可能原因**
1. 系统缺少运行库
2. 防病毒软件阻止运行
3. 程序文件损坏
**解决方案**
1. 以管理员身份运行程序
2. 临时关闭防病毒软件
3. 重新下载或编译程序
4. 检查系统事件查看器中的错误日志
#### 症状显示缺少DLL文件
**可能原因**
1. 系统缺少Visual C++运行库
2. .NET Framework版本过低
**解决方案**
1. 安装Visual C++ 2015-2022运行库
2. 更新.NET Framework到最新版本
3. 安装所有Windows更新
### OCR识别问题
#### 症状:所有图片都识别失败
**排查步骤**
1. **检查API密钥**
- 确认config.ini中的API密钥正确
- 验证密钥是否过期或被禁用
- 检查百度智能云账户余额
2. **检查网络连接**
- 测试能否访问百度智能云服务
- 检查防火墙设置
- 验证代理设置(如使用代理)
3. **检查图片文件**
- 确认图片格式正确
- 验证图片文件未损坏
- 检查文件大小是否超限
#### 症状:部分图片识别失败
**可能原因**
1. 图片质量问题
2. 图片格式不支持
3. 文件大小超过限制
**解决方案**
1. 重新扫描或拍摄图片
2. 转换图片格式为支持的格式
3. 压缩或调整图片大小
4. 手动处理失败的图片
### Excel处理问题
#### 症状Excel文件生成失败
**排查方法**
1. **检查磁盘空间**:确保有足够的可用空间
2. **验证文件权限**:确认有写入权限
3. **检查Excel格式**:确认模板文件格式正确
4. **查看错误日志**:获取详细的错误信息
#### 症状:商品信息提取错误
**常见原因**
1. Excel格式不规范
2. 表头识别错误
3. 数据格式不统一
**解决方法**
1. 标准化Excel格式
2. 手动指定表头行
3. 使用数据清洗功能
4. 调整提取规则
### 合并功能问题
#### 症状:合并后商品信息丢失
**可能原因**
1. 商品关键信息缺失
2. 合并规则设置不当
3. 文件格式不兼容
**解决方案**
1. 确保所有商品都有条码或名称
2. 调整合并规则配置
3. 统一文件格式和结构
### 性能问题
#### 症状:系统响应缓慢
**优化建议**
1. **减少并发数**降低max_workers值
2. **减小批大小**减少batch_size值
3. **清理临时文件**定期清理temp目录
4. **增加内存**:关闭其他占用内存的程序
#### 症状:处理过程中崩溃
**排查步骤**
1. 检查系统内存使用情况
2. 查看Windows事件日志
3. 分析错误日志文件
4. 逐步减少处理量测试
## 最佳实践建议
### 日常使用建议
#### 1. 文件管理最佳实践
- **分类存储**:按日期或供应商分类存储图片文件
- **规范命名**:使用统一的文件命名规则
- **定期清理**:定期清理已处理的文件和临时文件
- **备份重要数据**:定期备份重要的采购单数据
#### 2. 图片质量优化
- **扫描设置**使用300DPI或更高分辨率扫描
- **光线控制**:确保充足均匀的光线
- **避免反光**:使用防反光材料或调整角度
- **保持平整**:确保采购单平整无折叠
#### 3. 处理效率提升
- **批量操作**:尽量使用批量处理功能
- **合理分批**:将大量文件分成小批次处理
- **预处理检查**:处理前检查图片质量
- **参数调优**:根据硬件配置调整处理参数
### 系统维护建议
#### 1. 定期维护任务
- **日志清理**:定期清理旧的日志文件
- **临时文件清理**清理temp目录中的临时文件
- **配置备份**:定期备份配置文件
- **更新检查**:关注系统更新和补丁
#### 2. 性能优化
- **硬件升级**根据需要升级内存和CPU
- **存储优化**使用SSD提高文件读写速度
- **网络优化**:确保稳定的网络连接
- **系统优化**:关闭不必要的服务和程序
#### 3. 安全建议
- **API密钥保护**妥善保管API密钥不要泄露
- **文件权限**:设置适当的文件访问权限
- **数据加密**:对敏感数据进行加密存储
- **定期备份**:建立定期备份机制
### 业务流程优化
#### 1. 采购流程整合
- **标准化格式**:统一采购单格式和标准
- **自动化集成**:与其他业务系统集成
- **数据验证**:建立数据质量检查机制
- **异常处理**:制定异常情况处理流程
#### 2. 质量控制
- **准确性检查**:定期抽查处理结果的准确性
- **性能监控**:监控系统处理性能指标
- **错误分析**:分析常见错误类型和原因
- **持续改进**:根据使用情况优化流程
#### 3. 团队协作
- **权限管理**:根据角色设置不同的操作权限
- **操作规范**:制定标准化的操作流程
- **培训体系**:建立用户培训和技能提升机制
- **经验分享**:定期分享使用经验和技巧
### 故障预防
#### 1. 预防措施
- **定期测试**:定期测试系统各项功能
- **监控告警**:建立系统监控和告警机制
- **容量规划**:根据业务量规划系统容量
- **应急预案**:制定系统故障应急预案
#### 2. 问题响应
- **快速定位**:建立问题快速定位和诊断机制
- **分级处理**:根据问题严重程度分级处理
- **升级机制**:建立问题升级和汇报机制
- **恢复流程**:制定系统恢复和重启流程
通过遵循这些最佳实践建议,用户可以更高效、更稳定地使用益选-OCR订单处理系统获得更好的使用体验和业务价值。