沧海拾贝 | 多方向证照图片的OCR方案详解

多方向证照图片的OCR方案详解
- 2022-06-16 19:43
- 字数 562
- 阅读 42
在诸如文档扫描、证照拍摄等过程中，有时为了拍摄更清晰，会将拍摄设备进行旋转，导致得到的图片也是不同方向的。此时，标准的OCR流程无法很好地应对这些数据。利用图像分类技术，可以预先判断含文字图像的方向，并将其进行方向调整，从而提高OCR处理的准确性。该案例提供了用户使用 PaddleClas 的超轻量图像分类方案（PULC，Practical Ultra Lightweight image Classification）快速构建轻量级、高精度、可落地的含文字图像方向的分类模型。该模型可以广泛应用于金融、政务等行业的旋转图片的OCR处理场景中。
但在真实产业中，要实现高精度的文字图像方向不是一件容易的事，在实际场景中存在着各种各样的问题：
如何能够在不影响整体流程速度的前提下达到最高的方向识别精度；
拍摄的照片会存在像素低、光线暗等问题；
针对上述场景，本次飞桨产业实践范例库推出了针对多方向的证照图片的OCR实践示例，提供从数据准备、技术方案、模型训练优化，到模型部署的全流程可复用方案，有效解决了对不同方向的证照图片进行有效OCR处理的问题，并且极大地降低了数据标注和算力成本，适用于金融、政府等多个产业应用。
教程地址：https://aistudio.baidu.com/aistudio/projectdetail/4226610

多方向证照图片的OCR方案详解

推荐阅读