本教程展示如何创建一个Java应用程序,该应用程序使用LEADTOOLS SDK对图像进行预处理以实现OCR识别。
概述 | |
---|---|
总结 | 本教程介绍如何在Java应用程序中使用LEADTOOLS图像处理SDK技术 |
完成时间 | 30分钟 |
项目 | 下载教程项目(2kb) |
平台 | Java应用程序 |
IDE | Eclipse |
运行许可证 | 下载LEADTOOLS |
用另一种语言试试 |
|
步骤熟悉创建项目的基本步骤添加引用和设置License教程,在工作之前预处理图像的OCR - Java教程。
在Eclipse中,创建一个新的Java项目,并添加必要的LEADTOOLS引用。
所需要的参考资料取决于项目的目的。本教程需要以下JAR文件:
JAR文件位于< INSTALL_DIR > \ LEADTOOLS21 \ Bin \ Java
leadtools.jar
leadtools.codecs.jar
leadtools.document.writer.jar
leadtools.ocr.jar
许可证解锁项目所需的特性。它必须在调用任何工具箱函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时License.
有两种类型的运行时许可证:
请注意
中更详细地介绍了添加LEADTOOLS引用和设置许可添加引用和设置License教程。
随着项目的创建、引用的添加和许可的设置,编码就可以开始了。
在Package Explorer,打开_Main.java
类。添加以下内容进口
语句添加到顶部的导入块。
进口java.io.IOException;
进口java.nio.file.Files;
进口java.nio.file.Paths;
进口leadtools。*;
进口leadtools.codecs。*;
进口leadtools.document.writer。*;
进口leadtools.ocr。*;
添加一个名为OCRPreprocess ()
到_Main
类。在主要
方法,在SetLicense()调用之后。
公共静态无效main (String [] args)抛出IOException
{
Platform.setLibPath (“C: \ \ LEADTOOLS21 \ \ Bin \ \ CDLL \ \ x64”);
Platform.loadLibrary (LTLibrary.LEADTOOLS);
Platform.loadLibrary (LTLibrary.CODECS);
Platform.loadLibrary (LTLibrary.DOCUMENT_WRITER);
Platform.loadLibrary (LTLibrary.OCR);
SetLicense ();
OCRPreprocess ();
}
静态无效OCRPreprocess ()
{
字符串tifFileName =“C: \ \ LEADTOOLS21 \ \ \ \ \ \图片资源ocr1.tif”;
字符串pdfFileName =“C: \ \ LEADTOOLS21 \ \ \ \ \ \图片资源cleanupTIF.pdf”;
RasterCodecs codecs =新RasterCodecs ();
RasterImage image = codecs.load(tifFileName);
OcrEngine OcrEngine = OcrEngineManager.createEngine(ocrengintype . lead);
ocrEngine.startup (新RasterCodecs (),新DocumentWriter (),零,零);
OcrDocument OcrDocument = ocreengine . getdocumentmanager ().createDocument();
OcrPage OcrPage = ocrDocument.getPages().addPage(图像,零);
//自动预处理
ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.DESKEW零);
ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.INVERT零);
ocrPage.autoPreprocess (OcrAutoPreprocessPageCommand.ROTATE零);
//识别并另存为PDF
ocrPage.recognize (零);
ocrDocument。保存(pdfFileName DocumentFormat.PDF,零);
System.out.println (“文件保存成功。”);
}
通过选择运行项目运行->运行.
如果正确地执行了这些步骤,应用程序应该对TIFF进行OCR,并提供一个经过清理的可搜索PDF文档。
本教程展示了如何初始化LEAD OCR引擎、处理指定的输入文件、对其进行预处理,以及以指定的格式将识别结果输出到指定的输出文件。