orc-order-v2/doc/USER_MANUAL.md
2025-11-15 18:46:03 +08:00

14 KiB
Raw Blame History

益选-OCR订单处理系统 - 用户操作手册

界面功能介绍

主界面布局

启动界面

系统启动时会显示一个简洁的启动界面,包含:

  • 系统标题:益选-OCR订单处理系统
  • 版本信息:显示当前系统版本
  • 加载进度:显示系统初始化进度

主操作界面

主界面采用现代化设计风格,包含以下主要区域:

顶部工具栏
  • 系统标题:显示在界面顶部中央
  • 主题切换:支持浅色/深色主题切换
  • 帮助按钮:访问用户手册和系统信息
功能按钮区域
  • OCR识别按钮:启动图片识别功能
  • Excel处理按钮处理OCR识别结果
  • 采购单合并按钮:合并多个采购单
  • 完整流程按钮:执行完整的处理流程
  • 配置管理按钮:打开系统配置界面
状态栏
  • 状态显示:显示当前系统状态(就绪/处理中/完成)
  • 进度条:显示处理进度百分比
  • 时间信息:显示处理开始时间和耗时
日志显示区域
  • 实时日志:显示处理过程的详细日志
  • 颜色标识:不同级别的日志使用不同颜色
  • 滚动支持:支持日志内容的滚动查看
  • 清空功能:可以清空当前日志内容

功能界面详解

OCR识别界面

当点击OCR识别按钮时系统会

  1. 自动扫描data/input目录中的图片文件
  2. 显示找到的图片文件数量
  3. 开始批量OCR识别处理
  4. 实时显示处理进度和结果

Excel处理界面

处理OCR结果时系统会

  1. 读取OCR生成的Excel文件
  2. 提取商品信息(条码、名称、规格、数量、单价)
  3. 应用数据清洗和标准化规则
  4. 生成标准格式的采购单

采购单合并界面

合并功能界面提供:

  1. 选择要合并的采购单文件
  2. 显示合并进度和状态
  3. 展示合并结果摘要
  4. 提供合并后文件的快速访问

配置管理界面

配置界面包含:

  1. 基本设置:输入输出目录配置
  2. API配置百度OCR API密钥设置
  3. 性能设置:批量处理参数配置
  4. 高级设置:其他高级参数配置

详细操作步骤

首次使用设置

1. 系统安装和配置

步骤1.1:确保系统环境满足要求

  • 操作系统Windows 7/8/10/11LinuxmacOS
  • Python版本3.8或更高版本(如使用源码)

步骤1.2获取百度OCR API密钥

  1. 访问百度智能云官网(https://cloud.baidu.com/
  2. 注册并登录账号
  3. 进入"文字识别"服务
  4. 创建应用获取API Key和Secret Key
  5. 记录这两个密钥,后续配置需要使用

步骤1.3:配置系统参数

  1. 打开config.ini文件
  2. [API]部分填入获取的密钥:
[API]
api_key = 你的API密钥
secret_key = 你的Secret密钥
timeout = 30
max_retries = 3
retry_delay = 2
  1. 配置输入输出路径:
[Paths]
input_folder = data/input
output_folder = data/output
temp_folder = data/temp

2. 准备图片文件

步骤2.1:创建图片文件夹 在系统目录下确保存在以下文件夹:

  • data/input/ - 存放待处理的采购单图片
  • data/output/ - 存放处理结果

步骤2.2:图片质量要求

  • 分辨率建议300DPI或更高
  • 格式支持JPG、JPEG、PNG、BMP格式
  • 大小单张图片不超过4MB
  • 清晰度:文字清晰,无模糊、反光

步骤2.3:图片命名规范

  • 使用有意义的文件名,如"采购单_20250101.jpg"
  • 避免使用特殊字符和空格
  • 建议使用日期和序号进行命名

基本操作流程

单张图片处理流程

步骤1:启动系统

  1. 双击OCR订单处理系统.exe或在命令行运行python 启动器.py
  2. 等待系统初始化完成(状态栏显示"就绪"

步骤2:放置图片文件

  1. 将采购单图片文件复制到data/input/目录
  2. 确保图片格式正确,质量良好

步骤3执行OCR识别

  1. 点击"OCR识别"按钮
  2. 系统会自动扫描输入目录
  3. 在日志区域查看处理进度
  4. 等待识别完成

步骤4处理Excel结果

  1. 点击"Excel处理"按钮
  2. 系统会读取OCR生成的Excel文件
  3. 提取商品信息并标准化
  4. 生成标准采购单格式

步骤5:查看处理结果

  1. 处理完成后,点击"打开输出目录"
  2. 查看生成的Excel采购单文件
  3. 核对商品信息是否正确

批量处理流程

步骤1:准备多张图片

  1. 将多个采购单图片放入data/input/目录
  2. 确保所有图片都符合质量要求

步骤2:执行完整流程

  1. 点击"完整流程"按钮
  2. 系统会依次执行:
    • OCR识别所有图片
    • 处理所有Excel文件
    • 合并相同商品
  3. 查看批量处理结果

步骤3:监控处理进度

  1. 观察状态栏的进度条
  2. 查看日志区域的详细信息
  3. 如有错误,查看错误信息并处理

高级功能使用

条码映射配置

步骤1:打开条码映射文件

  1. 编辑config/barcode_mappings.json文件
  2. 按照JSON格式添加映射规则

步骤2:配置映射规则

{
  "原条码1": "目标条码1",
  "原条码2": "目标条码2",
  "6901234567890": "新条码123456"
}

步骤3:应用映射规则

  1. 系统在处理时会自动应用映射
  2. 原条码会被替换为目标条码
  3. 适用于不同系统的条码适配

自定义模板使用

步骤1:准备模板文件

  1. templates/目录放置Excel模板
  2. 模板应包含标准的采购单格式

步骤2:配置模板

  1. config.ini中配置模板:
[Templates]
purchase_order = 银豹-采购单模板.xls

步骤3:使用模板

  1. 系统生成采购单时会使用指定模板
  2. 确保模板格式与系统要求匹配

性能调优

步骤1:调整批量处理参数 在config.ini中配置:

[Performance]
max_workers = 4      # 最大工作线程数
batch_size = 5       # 每批处理文件数
skip_existing = true # 跳过已处理文件

步骤2:优化处理策略

  • 根据电脑性能调整线程数
  • 大批量处理时适当增加批大小
  • 启用跳过已处理文件以提高效率

步骤3:监控资源使用

  • 观察CPU和内存使用情况
  • 根据系统资源调整参数
  • 避免设置过高的并发数

常见问题解答

Q1: 系统无法启动怎么办?

A1:

  1. 检查Python环境是否正确安装源码版本
  2. 确认所有依赖库已安装:pip install -r requirements.txt
  3. 检查是否有足够的系统权限
  4. 查看错误日志获取详细信息

Q2: OCR识别失败如何处理

A2:

  1. 检查图片质量是否满足要求
  2. 确认图片格式是否支持
  3. 验证百度OCR API密钥是否正确
  4. 检查网络连接是否正常
  5. 尝试降低图片分辨率或压缩图片大小

Q3: 识别结果不准确怎么办?

A3:

  1. 提高图片扫描分辨率
  2. 确保图片光线充足,无反光
  3. 检查采购单格式是否规范
  4. 手动校正重要的商品信息
  5. 考虑使用更高质量的扫描设备

Q4: 批量处理时系统卡顿?

A4:

  1. 降低批量处理的并发线程数
  2. 减小每批处理的文件数量
  3. 关闭其他占用资源的程序
  4. 增加系统内存或使用更高配置的电脑

Q5: 生成的Excel文件打不开

A5:

  1. 确认已安装Excel或兼容软件
  2. 检查文件是否完整生成
  3. 验证文件路径是否正确
  4. 尝试使用不同版本的Excel打开
  5. 检查是否有足够的磁盘空间

Q6: 条码映射不生效?

A6:

  1. 检查JSON文件格式是否正确
  2. 确认条码映射文件路径正确
  3. 验证原条码和目标条码格式
  4. 重启系统使配置生效
  5. 检查日志中是否有映射相关的错误信息

Q7: 处理速度很慢怎么办?

A7:

  1. 优化网络连接,使用稳定的网络
  2. 调整批量处理参数
  3. 使用本地缓存减少API调用
  4. 考虑使用更高性能的硬件
  5. 分批处理大量文件,避免一次性处理过多

Q8: 系统显示"未找到可合并的文件"

A8:

  1. 确认输出目录中有Excel文件
  2. 检查文件格式是否符合要求
  3. 验证文件是否包含有效的商品数据
  4. 确保文件没有被其他程序锁定

故障排除指南

系统启动问题

症状:双击程序无反应

可能原因

  1. 系统缺少运行库
  2. 防病毒软件阻止运行
  3. 程序文件损坏

解决方案

  1. 以管理员身份运行程序
  2. 临时关闭防病毒软件
  3. 重新下载或编译程序
  4. 检查系统事件查看器中的错误日志

症状显示缺少DLL文件

可能原因

  1. 系统缺少Visual C++运行库
  2. .NET Framework版本过低

解决方案

  1. 安装Visual C++ 2015-2022运行库
  2. 更新.NET Framework到最新版本
  3. 安装所有Windows更新

OCR识别问题

症状:所有图片都识别失败

排查步骤

  1. 检查API密钥

    • 确认config.ini中的API密钥正确
    • 验证密钥是否过期或被禁用
    • 检查百度智能云账户余额
  2. 检查网络连接

    • 测试能否访问百度智能云服务
    • 检查防火墙设置
    • 验证代理设置(如使用代理)
  3. 检查图片文件

    • 确认图片格式正确
    • 验证图片文件未损坏
    • 检查文件大小是否超限

症状:部分图片识别失败

可能原因

  1. 图片质量问题
  2. 图片格式不支持
  3. 文件大小超过限制

解决方案

  1. 重新扫描或拍摄图片
  2. 转换图片格式为支持的格式
  3. 压缩或调整图片大小
  4. 手动处理失败的图片

Excel处理问题

症状Excel文件生成失败

排查方法

  1. 检查磁盘空间:确保有足够的可用空间
  2. 验证文件权限:确认有写入权限
  3. 检查Excel格式:确认模板文件格式正确
  4. 查看错误日志:获取详细的错误信息

症状:商品信息提取错误

常见原因

  1. Excel格式不规范
  2. 表头识别错误
  3. 数据格式不统一

解决方法

  1. 标准化Excel格式
  2. 手动指定表头行
  3. 使用数据清洗功能
  4. 调整提取规则

合并功能问题

症状:合并后商品信息丢失

可能原因

  1. 商品关键信息缺失
  2. 合并规则设置不当
  3. 文件格式不兼容

解决方案

  1. 确保所有商品都有条码或名称
  2. 调整合并规则配置
  3. 统一文件格式和结构

性能问题

症状:系统响应缓慢

优化建议

  1. 减少并发数降低max_workers值
  2. 减小批大小减少batch_size值
  3. 清理临时文件定期清理temp目录
  4. 增加内存:关闭其他占用内存的程序

症状:处理过程中崩溃

排查步骤

  1. 检查系统内存使用情况
  2. 查看Windows事件日志
  3. 分析错误日志文件
  4. 逐步减少处理量测试

最佳实践建议

日常使用建议

1. 文件管理最佳实践

  • 分类存储:按日期或供应商分类存储图片文件
  • 规范命名:使用统一的文件命名规则
  • 定期清理:定期清理已处理的文件和临时文件
  • 备份重要数据:定期备份重要的采购单数据

2. 图片质量优化

  • 扫描设置使用300DPI或更高分辨率扫描
  • 光线控制:确保充足均匀的光线
  • 避免反光:使用防反光材料或调整角度
  • 保持平整:确保采购单平整无折叠

3. 处理效率提升

  • 批量操作:尽量使用批量处理功能
  • 合理分批:将大量文件分成小批次处理
  • 预处理检查:处理前检查图片质量
  • 参数调优:根据硬件配置调整处理参数

系统维护建议

1. 定期维护任务

  • 日志清理:定期清理旧的日志文件
  • 临时文件清理清理temp目录中的临时文件
  • 配置备份:定期备份配置文件
  • 更新检查:关注系统更新和补丁

2. 性能优化

  • 硬件升级根据需要升级内存和CPU
  • 存储优化使用SSD提高文件读写速度
  • 网络优化:确保稳定的网络连接
  • 系统优化:关闭不必要的服务和程序

3. 安全建议

  • API密钥保护妥善保管API密钥不要泄露
  • 文件权限:设置适当的文件访问权限
  • 数据加密:对敏感数据进行加密存储
  • 定期备份:建立定期备份机制

业务流程优化

1. 采购流程整合

  • 标准化格式:统一采购单格式和标准
  • 自动化集成:与其他业务系统集成
  • 数据验证:建立数据质量检查机制
  • 异常处理:制定异常情况处理流程

2. 质量控制

  • 准确性检查:定期抽查处理结果的准确性
  • 性能监控:监控系统处理性能指标
  • 错误分析:分析常见错误类型和原因
  • 持续改进:根据使用情况优化流程

3. 团队协作

  • 权限管理:根据角色设置不同的操作权限
  • 操作规范:制定标准化的操作流程
  • 培训体系:建立用户培训和技能提升机制
  • 经验分享:定期分享使用经验和技巧

故障预防

1. 预防措施

  • 定期测试:定期测试系统各项功能
  • 监控告警:建立系统监控和告警机制
  • 容量规划:根据业务量规划系统容量
  • 应急预案:制定系统故障应急预案

2. 问题响应

  • 快速定位:建立问题快速定位和诊断机制
  • 分级处理:根据问题严重程度分级处理
  • 升级机制:建立问题升级和汇报机制
  • 恢复流程:制定系统恢复和重启流程

通过遵循这些最佳实践建议,用户可以更高效、更稳定地使用益选-OCR订单处理系统获得更好的使用体验和业务价值。