预处理图像的OCR - Java

本教程展示如何创建一个Java应用程序,该应用程序使用LEADTOOLS SDK对图像进行预处理以实现OCR识别。

概述
总结 本教程介绍如何在Java应用程序中使用LEADTOOLS图像处理SDK技术
完成时间 30分钟
项目 下载教程项目(2kb)
平台 Java应用程序
IDE Eclipse
运行许可证 下载LEADTOOLS
用另一种语言试试

所需的知识

步骤熟悉创建项目的基本步骤添加引用和设置License教程,在工作之前预处理图像的OCR - Java教程。

创建项目并添加LEADTOOLS引用

在Eclipse中,创建一个新的Java项目,并添加必要的LEADTOOLS引用。

所需要的参考资料取决于项目的目的。本教程需要以下JAR文件:

JAR文件位于< INSTALL_DIR > \ LEADTOOLS21 \ Bin \ Java

设置License文件

许可证解锁项目所需的特性。它必须在调用任何工具箱函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时License

有两种类型的运行时许可证:

请注意

中更详细地介绍了添加LEADTOOLS引用和设置许可添加引用和设置License教程。

增加图像预处理和OCR代码

随着项目的创建、引用的添加和许可的设置,编码就可以开始了。

Package Explorer,打开_Main.java类。添加以下内容进口语句添加到顶部的导入块。

Java
进口java.io.IOException;进口java.nio.file.Files;进口java.nio.file.Paths;进口leadtools。*;进口leadtools.codecs。*;进口leadtools.document.writer。*;进口leadtools.ocr。*;

添加一个名为OCRPreprocess ()_Main类。在主要方法,在SetLicense()调用之后。

Java
公共静态无效main (String [] args)抛出IOExceptionPlatform.setLibPath (“C: \ \ LEADTOOLS21 \ \ Bin \ \ CDLL \ \ x64”);Platform.loadLibrary (LTLibrary.LEADTOOLS);Platform.loadLibrary (LTLibrary.CODECS);Platform.loadLibrary (LTLibrary.DOCUMENT_WRITER);Platform.loadLibrary (LTLibrary.OCR);SetLicense ();OCRPreprocess ();
Java
静态无效OCRPreprocess ()字符串tifFileName =“C: \ \ LEADTOOLS21 \ \ \ \ \ \图片资源ocr1.tif”字符串pdfFileName =“C: \ \ LEADTOOLS21 \ \ \ \ \ \图片资源cleanupTIF.pdf”RasterCodecs codecs =RasterCodecs ();RasterImage image = codecs.load(tifFileName);OcrEngine OcrEngine = OcrEngineManager.createEngine(ocrengintype . lead);ocrEngine.startup (RasterCodecs (),DocumentWriter (),);OcrDocument OcrDocument = ocreengine . getdocumentmanager ().createDocument();OcrPage OcrPage = ocrDocument.getPages().addPage(图像,);//自动预处理ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.DESKEW);ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.INVERT);ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.ROTATE);//识别并另存为PDFocrPage.recognize ();ocrDocument。保存(pdfFileName DocumentFormat.PDF,);System.out.println (“文件保存成功。”);

运行项目

通过选择运行项目运行->运行

如果正确地执行了这些步骤,应用程序应该对TIFF进行OCR,并提供一个经过清理的可搜索PDF文档。

总结

本教程展示了如何初始化LEAD OCR引擎、处理指定的输入文件、对其进行预处理,以及以指定的格式将识别结果输出到指定的输出文件。

另请参阅

net
iOS
188金宝搏的网址客服|支持|联系我们|知识产权公告
©1991 - 2021领德科技有限公司版权所有。