14 KiB
14 KiB
益选-OCR订单处理系统 - 用户操作手册
界面功能介绍
主界面布局
启动界面
系统启动时会显示一个简洁的启动界面,包含:
- 系统标题:益选-OCR订单处理系统
- 版本信息:显示当前系统版本
- 加载进度:显示系统初始化进度
主操作界面
主界面采用现代化设计风格,包含以下主要区域:
顶部工具栏
- 系统标题:显示在界面顶部中央
- 主题切换:支持浅色/深色主题切换
- 帮助按钮:访问用户手册和系统信息
功能按钮区域
- OCR识别按钮:启动图片识别功能
- Excel处理按钮:处理OCR识别结果
- 采购单合并按钮:合并多个采购单
- 完整流程按钮:执行完整的处理流程
- 配置管理按钮:打开系统配置界面
状态栏
- 状态显示:显示当前系统状态(就绪/处理中/完成)
- 进度条:显示处理进度百分比
- 时间信息:显示处理开始时间和耗时
日志显示区域
- 实时日志:显示处理过程的详细日志
- 颜色标识:不同级别的日志使用不同颜色
- 滚动支持:支持日志内容的滚动查看
- 清空功能:可以清空当前日志内容
功能界面详解
OCR识别界面
当点击OCR识别按钮时,系统会:
- 自动扫描
data/input目录中的图片文件 - 显示找到的图片文件数量
- 开始批量OCR识别处理
- 实时显示处理进度和结果
Excel处理界面
处理OCR结果时,系统会:
- 读取OCR生成的Excel文件
- 提取商品信息(条码、名称、规格、数量、单价)
- 应用数据清洗和标准化规则
- 生成标准格式的采购单
采购单合并界面
合并功能界面提供:
- 选择要合并的采购单文件
- 显示合并进度和状态
- 展示合并结果摘要
- 提供合并后文件的快速访问
配置管理界面
配置界面包含:
- 基本设置:输入输出目录配置
- API配置:百度OCR API密钥设置
- 性能设置:批量处理参数配置
- 高级设置:其他高级参数配置
详细操作步骤
首次使用设置
1. 系统安装和配置
步骤1.1:确保系统环境满足要求
- 操作系统:Windows 7/8/10/11,Linux,macOS
- Python版本:3.8或更高版本(如使用源码)
步骤1.2:获取百度OCR API密钥
- 访问百度智能云官网(https://cloud.baidu.com/)
- 注册并登录账号
- 进入"文字识别"服务
- 创建应用,获取API Key和Secret Key
- 记录这两个密钥,后续配置需要使用
步骤1.3:配置系统参数
- 打开
config.ini文件 - 在
[API]部分填入获取的密钥:
[API]
api_key = 你的API密钥
secret_key = 你的Secret密钥
timeout = 30
max_retries = 3
retry_delay = 2
- 配置输入输出路径:
[Paths]
input_folder = data/input
output_folder = data/output
temp_folder = data/temp
2. 准备图片文件
步骤2.1:创建图片文件夹 在系统目录下确保存在以下文件夹:
data/input/- 存放待处理的采购单图片data/output/- 存放处理结果
步骤2.2:图片质量要求
- 分辨率:建议300DPI或更高
- 格式:支持JPG、JPEG、PNG、BMP格式
- 大小:单张图片不超过4MB
- 清晰度:文字清晰,无模糊、反光
步骤2.3:图片命名规范
- 使用有意义的文件名,如"采购单_20250101.jpg"
- 避免使用特殊字符和空格
- 建议使用日期和序号进行命名
基本操作流程
单张图片处理流程
步骤1:启动系统
- 双击
OCR订单处理系统.exe或在命令行运行python 启动器.py - 等待系统初始化完成(状态栏显示"就绪")
步骤2:放置图片文件
- 将采购单图片文件复制到
data/input/目录 - 确保图片格式正确,质量良好
步骤3:执行OCR识别
- 点击"OCR识别"按钮
- 系统会自动扫描输入目录
- 在日志区域查看处理进度
- 等待识别完成
步骤4:处理Excel结果
- 点击"Excel处理"按钮
- 系统会读取OCR生成的Excel文件
- 提取商品信息并标准化
- 生成标准采购单格式
步骤5:查看处理结果
- 处理完成后,点击"打开输出目录"
- 查看生成的Excel采购单文件
- 核对商品信息是否正确
批量处理流程
步骤1:准备多张图片
- 将多个采购单图片放入
data/input/目录 - 确保所有图片都符合质量要求
步骤2:执行完整流程
- 点击"完整流程"按钮
- 系统会依次执行:
- OCR识别所有图片
- 处理所有Excel文件
- 合并相同商品
- 查看批量处理结果
步骤3:监控处理进度
- 观察状态栏的进度条
- 查看日志区域的详细信息
- 如有错误,查看错误信息并处理
高级功能使用
条码映射配置
步骤1:打开条码映射文件
- 编辑
config/barcode_mappings.json文件 - 按照JSON格式添加映射规则
步骤2:配置映射规则
{
"原条码1": "目标条码1",
"原条码2": "目标条码2",
"6901234567890": "新条码123456"
}
步骤3:应用映射规则
- 系统在处理时会自动应用映射
- 原条码会被替换为目标条码
- 适用于不同系统的条码适配
自定义模板使用
步骤1:准备模板文件
- 在
templates/目录放置Excel模板 - 模板应包含标准的采购单格式
步骤2:配置模板
- 在
config.ini中配置模板:
[Templates]
purchase_order = 银豹-采购单模板.xls
步骤3:使用模板
- 系统生成采购单时会使用指定模板
- 确保模板格式与系统要求匹配
性能调优
步骤1:调整批量处理参数
在config.ini中配置:
[Performance]
max_workers = 4 # 最大工作线程数
batch_size = 5 # 每批处理文件数
skip_existing = true # 跳过已处理文件
步骤2:优化处理策略
- 根据电脑性能调整线程数
- 大批量处理时适当增加批大小
- 启用跳过已处理文件以提高效率
步骤3:监控资源使用
- 观察CPU和内存使用情况
- 根据系统资源调整参数
- 避免设置过高的并发数
常见问题解答
Q1: 系统无法启动怎么办?
A1:
- 检查Python环境是否正确安装(源码版本)
- 确认所有依赖库已安装:
pip install -r requirements.txt - 检查是否有足够的系统权限
- 查看错误日志获取详细信息
Q2: OCR识别失败如何处理?
A2:
- 检查图片质量是否满足要求
- 确认图片格式是否支持
- 验证百度OCR API密钥是否正确
- 检查网络连接是否正常
- 尝试降低图片分辨率或压缩图片大小
Q3: 识别结果不准确怎么办?
A3:
- 提高图片扫描分辨率
- 确保图片光线充足,无反光
- 检查采购单格式是否规范
- 手动校正重要的商品信息
- 考虑使用更高质量的扫描设备
Q4: 批量处理时系统卡顿?
A4:
- 降低批量处理的并发线程数
- 减小每批处理的文件数量
- 关闭其他占用资源的程序
- 增加系统内存或使用更高配置的电脑
Q5: 生成的Excel文件打不开?
A5:
- 确认已安装Excel或兼容软件
- 检查文件是否完整生成
- 验证文件路径是否正确
- 尝试使用不同版本的Excel打开
- 检查是否有足够的磁盘空间
Q6: 条码映射不生效?
A6:
- 检查JSON文件格式是否正确
- 确认条码映射文件路径正确
- 验证原条码和目标条码格式
- 重启系统使配置生效
- 检查日志中是否有映射相关的错误信息
Q7: 处理速度很慢怎么办?
A7:
- 优化网络连接,使用稳定的网络
- 调整批量处理参数
- 使用本地缓存减少API调用
- 考虑使用更高性能的硬件
- 分批处理大量文件,避免一次性处理过多
Q8: 系统显示"未找到可合并的文件"?
A8:
- 确认输出目录中有Excel文件
- 检查文件格式是否符合要求
- 验证文件是否包含有效的商品数据
- 确保文件没有被其他程序锁定
故障排除指南
系统启动问题
症状:双击程序无反应
可能原因:
- 系统缺少运行库
- 防病毒软件阻止运行
- 程序文件损坏
解决方案:
- 以管理员身份运行程序
- 临时关闭防病毒软件
- 重新下载或编译程序
- 检查系统事件查看器中的错误日志
症状:显示缺少DLL文件
可能原因:
- 系统缺少Visual C++运行库
- .NET Framework版本过低
解决方案:
- 安装Visual C++ 2015-2022运行库
- 更新.NET Framework到最新版本
- 安装所有Windows更新
OCR识别问题
症状:所有图片都识别失败
排查步骤:
-
检查API密钥:
- 确认config.ini中的API密钥正确
- 验证密钥是否过期或被禁用
- 检查百度智能云账户余额
-
检查网络连接:
- 测试能否访问百度智能云服务
- 检查防火墙设置
- 验证代理设置(如使用代理)
-
检查图片文件:
- 确认图片格式正确
- 验证图片文件未损坏
- 检查文件大小是否超限
症状:部分图片识别失败
可能原因:
- 图片质量问题
- 图片格式不支持
- 文件大小超过限制
解决方案:
- 重新扫描或拍摄图片
- 转换图片格式为支持的格式
- 压缩或调整图片大小
- 手动处理失败的图片
Excel处理问题
症状:Excel文件生成失败
排查方法:
- 检查磁盘空间:确保有足够的可用空间
- 验证文件权限:确认有写入权限
- 检查Excel格式:确认模板文件格式正确
- 查看错误日志:获取详细的错误信息
症状:商品信息提取错误
常见原因:
- Excel格式不规范
- 表头识别错误
- 数据格式不统一
解决方法:
- 标准化Excel格式
- 手动指定表头行
- 使用数据清洗功能
- 调整提取规则
合并功能问题
症状:合并后商品信息丢失
可能原因:
- 商品关键信息缺失
- 合并规则设置不当
- 文件格式不兼容
解决方案:
- 确保所有商品都有条码或名称
- 调整合并规则配置
- 统一文件格式和结构
性能问题
症状:系统响应缓慢
优化建议:
- 减少并发数:降低max_workers值
- 减小批大小:减少batch_size值
- 清理临时文件:定期清理temp目录
- 增加内存:关闭其他占用内存的程序
症状:处理过程中崩溃
排查步骤:
- 检查系统内存使用情况
- 查看Windows事件日志
- 分析错误日志文件
- 逐步减少处理量测试
最佳实践建议
日常使用建议
1. 文件管理最佳实践
- 分类存储:按日期或供应商分类存储图片文件
- 规范命名:使用统一的文件命名规则
- 定期清理:定期清理已处理的文件和临时文件
- 备份重要数据:定期备份重要的采购单数据
2. 图片质量优化
- 扫描设置:使用300DPI或更高分辨率扫描
- 光线控制:确保充足均匀的光线
- 避免反光:使用防反光材料或调整角度
- 保持平整:确保采购单平整无折叠
3. 处理效率提升
- 批量操作:尽量使用批量处理功能
- 合理分批:将大量文件分成小批次处理
- 预处理检查:处理前检查图片质量
- 参数调优:根据硬件配置调整处理参数
系统维护建议
1. 定期维护任务
- 日志清理:定期清理旧的日志文件
- 临时文件清理:清理temp目录中的临时文件
- 配置备份:定期备份配置文件
- 更新检查:关注系统更新和补丁
2. 性能优化
- 硬件升级:根据需要升级内存和CPU
- 存储优化:使用SSD提高文件读写速度
- 网络优化:确保稳定的网络连接
- 系统优化:关闭不必要的服务和程序
3. 安全建议
- API密钥保护:妥善保管API密钥,不要泄露
- 文件权限:设置适当的文件访问权限
- 数据加密:对敏感数据进行加密存储
- 定期备份:建立定期备份机制
业务流程优化
1. 采购流程整合
- 标准化格式:统一采购单格式和标准
- 自动化集成:与其他业务系统集成
- 数据验证:建立数据质量检查机制
- 异常处理:制定异常情况处理流程
2. 质量控制
- 准确性检查:定期抽查处理结果的准确性
- 性能监控:监控系统处理性能指标
- 错误分析:分析常见错误类型和原因
- 持续改进:根据使用情况优化流程
3. 团队协作
- 权限管理:根据角色设置不同的操作权限
- 操作规范:制定标准化的操作流程
- 培训体系:建立用户培训和技能提升机制
- 经验分享:定期分享使用经验和技巧
故障预防
1. 预防措施
- 定期测试:定期测试系统各项功能
- 监控告警:建立系统监控和告警机制
- 容量规划:根据业务量规划系统容量
- 应急预案:制定系统故障应急预案
2. 问题响应
- 快速定位:建立问题快速定位和诊断机制
- 分级处理:根据问题严重程度分级处理
- 升级机制:建立问题升级和汇报机制
- 恢复流程:制定系统恢复和重启流程
通过遵循这些最佳实践建议,用户可以更高效、更稳定地使用益选-OCR订单处理系统,获得更好的使用体验和业务价值。