477 lines
14 KiB
Markdown
477 lines
14 KiB
Markdown
# 益选-OCR订单处理系统 - 用户操作手册
|
||
|
||
## 界面功能介绍
|
||
|
||
### 主界面布局
|
||
|
||
#### 启动界面
|
||
系统启动时会显示一个简洁的启动界面,包含:
|
||
- **系统标题**:益选-OCR订单处理系统
|
||
- **版本信息**:显示当前系统版本
|
||
- **加载进度**:显示系统初始化进度
|
||
|
||
#### 主操作界面
|
||
主界面采用现代化设计风格,包含以下主要区域:
|
||
|
||
##### 顶部工具栏
|
||
- **系统标题**:显示在界面顶部中央
|
||
- **主题切换**:支持浅色/深色主题切换
|
||
- **帮助按钮**:访问用户手册和系统信息
|
||
|
||
##### 功能按钮区域
|
||
- **OCR识别按钮**:启动图片识别功能
|
||
- **Excel处理按钮**:处理OCR识别结果
|
||
- **采购单合并按钮**:合并多个采购单
|
||
- **完整流程按钮**:执行完整的处理流程
|
||
- **配置管理按钮**:打开系统配置界面
|
||
|
||
##### 状态栏
|
||
- **状态显示**:显示当前系统状态(就绪/处理中/完成)
|
||
- **进度条**:显示处理进度百分比
|
||
- **时间信息**:显示处理开始时间和耗时
|
||
|
||
##### 日志显示区域
|
||
- **实时日志**:显示处理过程的详细日志
|
||
- **颜色标识**:不同级别的日志使用不同颜色
|
||
- **滚动支持**:支持日志内容的滚动查看
|
||
- **清空功能**:可以清空当前日志内容
|
||
|
||
### 功能界面详解
|
||
|
||
#### OCR识别界面
|
||
当点击OCR识别按钮时,系统会:
|
||
1. 自动扫描`data/input`目录中的图片文件
|
||
2. 显示找到的图片文件数量
|
||
3. 开始批量OCR识别处理
|
||
4. 实时显示处理进度和结果
|
||
|
||
#### Excel处理界面
|
||
处理OCR结果时,系统会:
|
||
1. 读取OCR生成的Excel文件
|
||
2. 提取商品信息(条码、名称、规格、数量、单价)
|
||
3. 应用数据清洗和标准化规则
|
||
4. 生成标准格式的采购单
|
||
|
||
#### 采购单合并界面
|
||
合并功能界面提供:
|
||
1. 选择要合并的采购单文件
|
||
2. 显示合并进度和状态
|
||
3. 展示合并结果摘要
|
||
4. 提供合并后文件的快速访问
|
||
|
||
#### 配置管理界面
|
||
配置界面包含:
|
||
1. **基本设置**:输入输出目录配置
|
||
2. **API配置**:百度OCR API密钥设置
|
||
3. **性能设置**:批量处理参数配置
|
||
4. **高级设置**:其他高级参数配置
|
||
|
||
## 详细操作步骤
|
||
|
||
### 首次使用设置
|
||
|
||
#### 1. 系统安装和配置
|
||
**步骤1.1**:确保系统环境满足要求
|
||
- 操作系统:Windows 7/8/10/11,Linux,macOS
|
||
- Python版本:3.8或更高版本(如使用源码)
|
||
|
||
**步骤1.2**:获取百度OCR API密钥
|
||
1. 访问百度智能云官网(https://cloud.baidu.com/)
|
||
2. 注册并登录账号
|
||
3. 进入"文字识别"服务
|
||
4. 创建应用,获取API Key和Secret Key
|
||
5. 记录这两个密钥,后续配置需要使用
|
||
|
||
**步骤1.3**:配置系统参数
|
||
1. 打开`config.ini`文件
|
||
2. 在`[API]`部分填入获取的密钥:
|
||
```ini
|
||
[API]
|
||
api_key = 你的API密钥
|
||
secret_key = 你的Secret密钥
|
||
timeout = 30
|
||
max_retries = 3
|
||
retry_delay = 2
|
||
```
|
||
|
||
3. 配置输入输出路径:
|
||
```ini
|
||
[Paths]
|
||
input_folder = data/input
|
||
output_folder = data/output
|
||
temp_folder = data/temp
|
||
```
|
||
|
||
#### 2. 准备图片文件
|
||
**步骤2.1**:创建图片文件夹
|
||
在系统目录下确保存在以下文件夹:
|
||
- `data/input/` - 存放待处理的采购单图片
|
||
- `data/output/` - 存放处理结果
|
||
|
||
**步骤2.2**:图片质量要求
|
||
- **分辨率**:建议300DPI或更高
|
||
- **格式**:支持JPG、JPEG、PNG、BMP格式
|
||
- **大小**:单张图片不超过4MB
|
||
- **清晰度**:文字清晰,无模糊、反光
|
||
|
||
**步骤2.3**:图片命名规范
|
||
- 使用有意义的文件名,如"采购单_20250101.jpg"
|
||
- 避免使用特殊字符和空格
|
||
- 建议使用日期和序号进行命名
|
||
|
||
### 基本操作流程
|
||
|
||
#### 单张图片处理流程
|
||
|
||
**步骤1**:启动系统
|
||
1. 双击`OCR订单处理系统.exe`或在命令行运行`python 启动器.py`
|
||
2. 等待系统初始化完成(状态栏显示"就绪")
|
||
|
||
**步骤2**:放置图片文件
|
||
1. 将采购单图片文件复制到`data/input/`目录
|
||
2. 确保图片格式正确,质量良好
|
||
|
||
**步骤3**:执行OCR识别
|
||
1. 点击"OCR识别"按钮
|
||
2. 系统会自动扫描输入目录
|
||
3. 在日志区域查看处理进度
|
||
4. 等待识别完成
|
||
|
||
**步骤4**:处理Excel结果
|
||
1. 点击"Excel处理"按钮
|
||
2. 系统会读取OCR生成的Excel文件
|
||
3. 提取商品信息并标准化
|
||
4. 生成标准采购单格式
|
||
|
||
**步骤5**:查看处理结果
|
||
1. 处理完成后,点击"打开输出目录"
|
||
2. 查看生成的Excel采购单文件
|
||
3. 核对商品信息是否正确
|
||
|
||
#### 批量处理流程
|
||
|
||
**步骤1**:准备多张图片
|
||
1. 将多个采购单图片放入`data/input/`目录
|
||
2. 确保所有图片都符合质量要求
|
||
|
||
**步骤2**:执行完整流程
|
||
1. 点击"完整流程"按钮
|
||
2. 系统会依次执行:
|
||
- OCR识别所有图片
|
||
- 处理所有Excel文件
|
||
- 合并相同商品
|
||
3. 查看批量处理结果
|
||
|
||
**步骤3**:监控处理进度
|
||
1. 观察状态栏的进度条
|
||
2. 查看日志区域的详细信息
|
||
3. 如有错误,查看错误信息并处理
|
||
|
||
### 高级功能使用
|
||
|
||
#### 条码映射配置
|
||
|
||
**步骤1**:打开条码映射文件
|
||
1. 编辑`config/barcode_mappings.json`文件
|
||
2. 按照JSON格式添加映射规则
|
||
|
||
**步骤2**:配置映射规则
|
||
```json
|
||
{
|
||
"原条码1": "目标条码1",
|
||
"原条码2": "目标条码2",
|
||
"6901234567890": "新条码123456"
|
||
}
|
||
```
|
||
|
||
**步骤3**:应用映射规则
|
||
1. 系统在处理时会自动应用映射
|
||
2. 原条码会被替换为目标条码
|
||
3. 适用于不同系统的条码适配
|
||
|
||
#### 自定义模板使用
|
||
|
||
**步骤1**:准备模板文件
|
||
1. 在`templates/`目录放置Excel模板
|
||
2. 模板应包含标准的采购单格式
|
||
|
||
**步骤2**:配置模板
|
||
1. 在`config.ini`中配置模板:
|
||
```ini
|
||
[Templates]
|
||
purchase_order = 银豹-采购单模板.xls
|
||
```
|
||
|
||
**步骤3**:使用模板
|
||
1. 系统生成采购单时会使用指定模板
|
||
2. 确保模板格式与系统要求匹配
|
||
|
||
#### 性能调优
|
||
|
||
**步骤1**:调整批量处理参数
|
||
在`config.ini`中配置:
|
||
```ini
|
||
[Performance]
|
||
max_workers = 4 # 最大工作线程数
|
||
batch_size = 5 # 每批处理文件数
|
||
skip_existing = true # 跳过已处理文件
|
||
```
|
||
|
||
**步骤2**:优化处理策略
|
||
- 根据电脑性能调整线程数
|
||
- 大批量处理时适当增加批大小
|
||
- 启用跳过已处理文件以提高效率
|
||
|
||
**步骤3**:监控资源使用
|
||
- 观察CPU和内存使用情况
|
||
- 根据系统资源调整参数
|
||
- 避免设置过高的并发数
|
||
|
||
## 常见问题解答
|
||
|
||
### Q1: 系统无法启动怎么办?
|
||
**A1**:
|
||
1. 检查Python环境是否正确安装(源码版本)
|
||
2. 确认所有依赖库已安装:`pip install -r requirements.txt`
|
||
3. 检查是否有足够的系统权限
|
||
4. 查看错误日志获取详细信息
|
||
|
||
### Q2: OCR识别失败如何处理?
|
||
**A2**:
|
||
1. 检查图片质量是否满足要求
|
||
2. 确认图片格式是否支持
|
||
3. 验证百度OCR API密钥是否正确
|
||
4. 检查网络连接是否正常
|
||
5. 尝试降低图片分辨率或压缩图片大小
|
||
|
||
### Q3: 识别结果不准确怎么办?
|
||
**A3**:
|
||
1. 提高图片扫描分辨率
|
||
2. 确保图片光线充足,无反光
|
||
3. 检查采购单格式是否规范
|
||
4. 手动校正重要的商品信息
|
||
5. 考虑使用更高质量的扫描设备
|
||
|
||
### Q4: 批量处理时系统卡顿?
|
||
**A4**:
|
||
1. 降低批量处理的并发线程数
|
||
2. 减小每批处理的文件数量
|
||
3. 关闭其他占用资源的程序
|
||
4. 增加系统内存或使用更高配置的电脑
|
||
|
||
### Q5: 生成的Excel文件打不开?
|
||
**A5**:
|
||
1. 确认已安装Excel或兼容软件
|
||
2. 检查文件是否完整生成
|
||
3. 验证文件路径是否正确
|
||
4. 尝试使用不同版本的Excel打开
|
||
5. 检查是否有足够的磁盘空间
|
||
|
||
### Q6: 条码映射不生效?
|
||
**A6**:
|
||
1. 检查JSON文件格式是否正确
|
||
2. 确认条码映射文件路径正确
|
||
3. 验证原条码和目标条码格式
|
||
4. 重启系统使配置生效
|
||
5. 检查日志中是否有映射相关的错误信息
|
||
|
||
### Q7: 处理速度很慢怎么办?
|
||
**A7**:
|
||
1. 优化网络连接,使用稳定的网络
|
||
2. 调整批量处理参数
|
||
3. 使用本地缓存减少API调用
|
||
4. 考虑使用更高性能的硬件
|
||
5. 分批处理大量文件,避免一次性处理过多
|
||
|
||
### Q8: 系统显示"未找到可合并的文件"?
|
||
**A8**:
|
||
1. 确认输出目录中有Excel文件
|
||
2. 检查文件格式是否符合要求
|
||
3. 验证文件是否包含有效的商品数据
|
||
4. 确保文件没有被其他程序锁定
|
||
|
||
## 故障排除指南
|
||
|
||
### 系统启动问题
|
||
|
||
#### 症状:双击程序无反应
|
||
**可能原因**:
|
||
1. 系统缺少运行库
|
||
2. 防病毒软件阻止运行
|
||
3. 程序文件损坏
|
||
|
||
**解决方案**:
|
||
1. 以管理员身份运行程序
|
||
2. 临时关闭防病毒软件
|
||
3. 重新下载或编译程序
|
||
4. 检查系统事件查看器中的错误日志
|
||
|
||
#### 症状:显示缺少DLL文件
|
||
**可能原因**:
|
||
1. 系统缺少Visual C++运行库
|
||
2. .NET Framework版本过低
|
||
|
||
**解决方案**:
|
||
1. 安装Visual C++ 2015-2022运行库
|
||
2. 更新.NET Framework到最新版本
|
||
3. 安装所有Windows更新
|
||
|
||
### OCR识别问题
|
||
|
||
#### 症状:所有图片都识别失败
|
||
**排查步骤**:
|
||
1. **检查API密钥**:
|
||
- 确认config.ini中的API密钥正确
|
||
- 验证密钥是否过期或被禁用
|
||
- 检查百度智能云账户余额
|
||
|
||
2. **检查网络连接**:
|
||
- 测试能否访问百度智能云服务
|
||
- 检查防火墙设置
|
||
- 验证代理设置(如使用代理)
|
||
|
||
3. **检查图片文件**:
|
||
- 确认图片格式正确
|
||
- 验证图片文件未损坏
|
||
- 检查文件大小是否超限
|
||
|
||
#### 症状:部分图片识别失败
|
||
**可能原因**:
|
||
1. 图片质量问题
|
||
2. 图片格式不支持
|
||
3. 文件大小超过限制
|
||
|
||
**解决方案**:
|
||
1. 重新扫描或拍摄图片
|
||
2. 转换图片格式为支持的格式
|
||
3. 压缩或调整图片大小
|
||
4. 手动处理失败的图片
|
||
|
||
### Excel处理问题
|
||
|
||
#### 症状:Excel文件生成失败
|
||
**排查方法**:
|
||
1. **检查磁盘空间**:确保有足够的可用空间
|
||
2. **验证文件权限**:确认有写入权限
|
||
3. **检查Excel格式**:确认模板文件格式正确
|
||
4. **查看错误日志**:获取详细的错误信息
|
||
|
||
#### 症状:商品信息提取错误
|
||
**常见原因**:
|
||
1. Excel格式不规范
|
||
2. 表头识别错误
|
||
3. 数据格式不统一
|
||
|
||
**解决方法**:
|
||
1. 标准化Excel格式
|
||
2. 手动指定表头行
|
||
3. 使用数据清洗功能
|
||
4. 调整提取规则
|
||
|
||
### 合并功能问题
|
||
|
||
#### 症状:合并后商品信息丢失
|
||
**可能原因**:
|
||
1. 商品关键信息缺失
|
||
2. 合并规则设置不当
|
||
3. 文件格式不兼容
|
||
|
||
**解决方案**:
|
||
1. 确保所有商品都有条码或名称
|
||
2. 调整合并规则配置
|
||
3. 统一文件格式和结构
|
||
|
||
### 性能问题
|
||
|
||
#### 症状:系统响应缓慢
|
||
**优化建议**:
|
||
1. **减少并发数**:降低max_workers值
|
||
2. **减小批大小**:减少batch_size值
|
||
3. **清理临时文件**:定期清理temp目录
|
||
4. **增加内存**:关闭其他占用内存的程序
|
||
|
||
#### 症状:处理过程中崩溃
|
||
**排查步骤**:
|
||
1. 检查系统内存使用情况
|
||
2. 查看Windows事件日志
|
||
3. 分析错误日志文件
|
||
4. 逐步减少处理量测试
|
||
|
||
## 最佳实践建议
|
||
|
||
### 日常使用建议
|
||
|
||
#### 1. 文件管理最佳实践
|
||
- **分类存储**:按日期或供应商分类存储图片文件
|
||
- **规范命名**:使用统一的文件命名规则
|
||
- **定期清理**:定期清理已处理的文件和临时文件
|
||
- **备份重要数据**:定期备份重要的采购单数据
|
||
|
||
#### 2. 图片质量优化
|
||
- **扫描设置**:使用300DPI或更高分辨率扫描
|
||
- **光线控制**:确保充足均匀的光线
|
||
- **避免反光**:使用防反光材料或调整角度
|
||
- **保持平整**:确保采购单平整无折叠
|
||
|
||
#### 3. 处理效率提升
|
||
- **批量操作**:尽量使用批量处理功能
|
||
- **合理分批**:将大量文件分成小批次处理
|
||
- **预处理检查**:处理前检查图片质量
|
||
- **参数调优**:根据硬件配置调整处理参数
|
||
|
||
### 系统维护建议
|
||
|
||
#### 1. 定期维护任务
|
||
- **日志清理**:定期清理旧的日志文件
|
||
- **临时文件清理**:清理temp目录中的临时文件
|
||
- **配置备份**:定期备份配置文件
|
||
- **更新检查**:关注系统更新和补丁
|
||
|
||
#### 2. 性能优化
|
||
- **硬件升级**:根据需要升级内存和CPU
|
||
- **存储优化**:使用SSD提高文件读写速度
|
||
- **网络优化**:确保稳定的网络连接
|
||
- **系统优化**:关闭不必要的服务和程序
|
||
|
||
#### 3. 安全建议
|
||
- **API密钥保护**:妥善保管API密钥,不要泄露
|
||
- **文件权限**:设置适当的文件访问权限
|
||
- **数据加密**:对敏感数据进行加密存储
|
||
- **定期备份**:建立定期备份机制
|
||
|
||
### 业务流程优化
|
||
|
||
#### 1. 采购流程整合
|
||
- **标准化格式**:统一采购单格式和标准
|
||
- **自动化集成**:与其他业务系统集成
|
||
- **数据验证**:建立数据质量检查机制
|
||
- **异常处理**:制定异常情况处理流程
|
||
|
||
#### 2. 质量控制
|
||
- **准确性检查**:定期抽查处理结果的准确性
|
||
- **性能监控**:监控系统处理性能指标
|
||
- **错误分析**:分析常见错误类型和原因
|
||
- **持续改进**:根据使用情况优化流程
|
||
|
||
#### 3. 团队协作
|
||
- **权限管理**:根据角色设置不同的操作权限
|
||
- **操作规范**:制定标准化的操作流程
|
||
- **培训体系**:建立用户培训和技能提升机制
|
||
- **经验分享**:定期分享使用经验和技巧
|
||
|
||
### 故障预防
|
||
|
||
#### 1. 预防措施
|
||
- **定期测试**:定期测试系统各项功能
|
||
- **监控告警**:建立系统监控和告警机制
|
||
- **容量规划**:根据业务量规划系统容量
|
||
- **应急预案**:制定系统故障应急预案
|
||
|
||
#### 2. 问题响应
|
||
- **快速定位**:建立问题快速定位和诊断机制
|
||
- **分级处理**:根据问题严重程度分级处理
|
||
- **升级机制**:建立问题升级和汇报机制
|
||
- **恢复流程**:制定系统恢复和重启流程
|
||
|
||
通过遵循这些最佳实践建议,用户可以更高效、更稳定地使用益选-OCR订单处理系统,获得更好的使用体验和业务价值。
|