调整图像色调以改善OCR结果

色调范围是一个重要的属性的图像,特别是照片,当试图提高OCR的结果.色调范围是图像最亮和最暗区域之间的色调范围,也被称为对比度。一个大范围的图像既有非常暗(黑)的元素,也有非常亮(白)的元素。窄范围的图像在色调范围上更受限制,通常是在中间范围(不同的灰色阴影)。

在OCR过程中,任何超过40%的色调范围的图像都可能导致不准确的识别。百分比是通过看PixelCount然后用这个数除以TotalPixelCount.百分比越高,像素越深。如果图像的文本颜色是黑色或深色,并且百分比很高,那么文本就有可能与图像的其他像素混合在一起。在这种情况下,OCR引擎将很难分离这些像素。

在LEADTOOLS图像处理SDK中包含的众多图像处理功能中,有StatisticsInformationCommand类,该类可用于返回关于图像和图像像素的统计信息。这个类有一个百分比属性这将得到图像中发现的色调范围的百分比值。如前所述,在处理从文档中提取文本时,您希望这个百分比较低。

使用两行代码和两个图像处理命令就可以轻松地修复百分比较高的图像

  • StretchIntensityCommand
    • 通过定心、最大化和按比例调整强度值的范围来增加图像的对比度
  • ChangeContrastCommand
    • 增加或减少图像的对比度。有效值为-1000 ~ +1000。
    public static void DoCleanUp(RasterImage image){//运行拉伸强度使最暗的颜色变为黑色新的StretchIntensityCommand().Run(image);//然后增加对比度以减少中音新的ChangeContrastCommand(){对比度= 1000}.Run(image);}

    在执行批处理OCR过程时,检查音调范围是有益的,因为这是一种快速和自动化的方法,使OCR引擎有最好的机会产生良好的结果。

    在下面的“之前和之后”的gif例子中,我演示了一个高百分比的图像和一个低百分比的图像之间的区别。

    Before_After_IP

    由开发人员支持工程师编写的c#项目可以从LEADTOOLS论坛

    这个条目是在图像处理和标记.书签的永久链接

    留下一个回复

    您的电邮地址将不会公布。必填项已标记