在本主题▼

预处理OCR - Console c#图像

本教程展示了如何创建一个c# Windows控制台应用程序，该应用程序使用LEADTOOLS SDK对图像进行预处理以进行OCR识别。

概述
总结	本教程介绍如何在c# Windows控制台应用程序中使用LEADTOOLS图像处理SDK技术
完成时间	30分钟
Visual Studio项目	下载教程项目(3kb)
平台	c# Windows控制台应用程序
IDE	Visual Studio 2017, 2019
开发许可	下载LEADTOOLS
用另一种语言试试	c#:.NET Framework(控制台)，net核心，.NET Framework (WinForms) Java:Java

所需的知识

步骤熟悉创建项目的基本步骤添加引用和设置License教程，在工作之前预处理OCR - Console c#图像教程。

创建项目并添加LEADTOOLS引用

中创建的项目的副本开始添加引用和设置License教程。如果您没有该项目，请按照该教程中的步骤创建它。

所需要的参考资料取决于项目的目的。引用可以通过以下两种方法中的一种添加(但不能同时添加)。本项目需要参考资料如下:

如果使用NuGet引用，本教程需要以下NuGet包:

Leadtools。光学字符识别

如果使用本地DLL引用，则需要以下DLL。dll位于< INSTALL_DIR > \ LEADTOOLS22 \ Bin \ Dotnet4 \ x64：

Leadtools.dll
Leadtools.Codecs.dll
Leadtools.Codecs.Fax.dll
Leadtools.Codecs.Jb2.dll
Leadtools.Codecs.Tif.dll
Leadtools.Document.Writer.dll
Leadtools.Ocr.dll
Leadtools.Ocr.LEADEngine.dll

有关应用程序需要哪些DLL文件的完整列表，请参阅在你的申请中包含的文件．

设置License文件

许可证解锁项目所需的特性。它必须在调用任何工具箱函数之前设置。有关详细信息，包括针对不同平台的教程，请参阅设置运行时License．

有两种类型的运行时许可证:

评估许可证，下载评估工具包时获得。它允许对工具包进行评估。
部署许可证。如果需要部署license文件和开发人员密钥，请参见获取License．

请注意

中详细介绍了添加LEADTOOLS NuGet和本地引用以及设置许可添加引用和设置License教程。

增加图像预处理和OCR代码

随着项目的创建、引用的添加和许可的设置，编码就可以开始了。

在解决方案资源管理器,打开Program.cs并将以下语句添加到使用顶部的块:

//在顶部使用块使用系统;使用先;使用Leadtools;使用Leadtools.Document.Writer;使用Leadtools.Ocr;

添加一个名为OCRPreProcessing ()并在主要方法。SetLicense ()方法调用。添加下面的代码来启动OCR引擎，加载TIFF图像作为IOcrPage，对TIF图像进行预处理，然后运行OCR识别并导出为可搜索的PDF。

静态无效OCRPreProcessing ()｛字符串tifFileName =@“C: \ LEADTOOLS22 \资源\ \ Clean.tif图像”；字符串pdfFileName =@“C: \ LEADTOOLS22 \资源\ \ Clean.pdf图像”；使用(IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead))｛//使用默认参数启动引擎ocrEngine。启动(零，零，零，@“C: \ LEADTOOLS22 \ Bin \常见\ OcrLEADRuntime”）;//创建一个OCR文档使用(IOcrDocument ocrDocument = ocreengine . documentmanager . createdocument ())｛//添加图片到文档中IOcrPage ocrPage = ocrDocument.Pages.AddPage(tifFileName，零）;//自动预处理ocrPage.AutoPreprocess (OcrAutoPreprocessPageCommand.Deskew零）;ocrPage.AutoPreprocess (OcrAutoPreprocessPageCommand.Invert零）;ocrPage.AutoPreprocess (OcrAutoPreprocessPageCommand.Rotate零）;//识别并另存为PDFocrPage。识别(零）;ocrDocument。保存(pdfFileName DocumentFormat.Pdf,零）;｝｝｝

运行项目

按下运行项目F5，或选择调试->开始调试．

如果正确地执行了这些步骤，应用程序应该对TIFF进行OCR，并提供一个经过清理的PDF文档。

总结

本教程展示了如何对图像进行OCR、清理图像并保存为PDF。此外，它还介绍了如何使用IOcrPage，IOcrDocument,IOcrEngine接口。

另请参阅

下载我们的免费评估

帮助版本22.0.2022.5.26

LEADTOOLS教程

开始使用LEADTOOLS安装程序

net核心

net

安卓

C DLL

云服务

码头工人

HTML5

iOS

Java

macOS

Xamarin的