用于OCR的图像预处理

文档/医疗扫描的文件并不总是笔直的。它们可能被扫描仪馈线倾斜或插入错误的方向(上下颠倒)。为了得到最好的结果,这些图像在被处理之前需要校正光学字符识别引擎。LEADTOOLS提供了许多预处理命令类,可用于校正图像的方向。其中包括ImageProcessing.Core.DeskewCommandImageProcessing.Core.SearchRegistrationMarksCommandDataImageProcessing.Core.PerspectiveDeskewCommand,ImageProcessing.Core.ManualPerspectiveDeskewCommand类。

预处理双(1位)图像

有关预处理双图像的更多信息,请参见清理1位图像

预处理彩色图像

有时文件是彩色扫描的。可以使用各种LEADTOOLS命令调整或增强彩色图像。有关更多信息,请参见Leadtools.ImageProcessing.Color

为了获得更好的结果,更实用的解决方案是在处理之前将图像转换为二进制(1位)图像。然而,将彩色图像转换为1位图像可能会导致一些重要特征的丢失,因为1位图像中缺乏颜色。方法将彩色图像转换为二进制图像ColorResolutionCommandIntensityDetectCommand或者是DynamicBinaryCommand类。ColorResolutionCommand使用固定的强度阈值128将图像转换为黑白。IntensityDetectCommand使用用户指定的强度范围将图像转换为黑白。在指定范围内的颜色被映射为白色,而在指定范围外的颜色被映射为黑色。DynamicBinaryCommand使用动态计算的阈值将图像转换为黑白。如果像素的强度高于动态阈值,像素将被设置为白色;否则,设置为黑色。这些命令使用户能够为OCR处理不同质量的彩色图像。

最佳颜色转换方法的选择取决于应用。例如,在护照图像上,信息文本是在纹理背景上用黑色书写的。与有纹理的背景相比,文本颜色非常暗。为了在这些图像上获得最好的OCR结果,建议使用低强度阈值将文本像素从背景像素中分割出来。这个分割过程由IntensityDetectCommand范围从低强度值开始,以255结束,例如(100到255)。通过观察这些图像上文本颜色和背景颜色的分布,通过经验估计低强度阈值,然后找到它们正态分布的交点。

有关使用LEADTOOLS OCR模块- LEAD引擎演示的教程,请参见如何OCR ID文件图像,如护照使用LEADTOOLS OCR模块- LEAD引擎汽车Binarize

将彩色图像转换为二进制图像的最复杂的方法是使用AutoBinarizeCommand.的AutoBinarizeCommand使用几个预处理和阈值操作,以保持彩色图像的关键特征。AutoBinarizeCommand可以根据所使用的特定输入设备进行调整,例如扫描仪或相机。它非常适合使不清晰的文档图像更具可读性。

下面的例子演示了如何使用AutoBinarizeCommand来检测文本并获得很好的结果:

之前

autobinarizebefore.jpg

autobinarizeafter.jpg

AutoBinarizeCommand类自动工作,但也允许自定义算法如何工作。选项包括是否对映像执行内部处理。您还可以选择要使用的阈值方法。

LEADTOOLS成像、医疗和文档
188金宝搏的网址客服|支持|联系我们|知识产权的通知
©1991 - 2021领先的技术公司。保留所有权利。