在这个话题▼

将图像转换为可搜索PDF OCR - c#控制台

本教程展示了如何创建一个c# Windows控制台应用程序,设置OCR OCR引擎的过程。

概述
总结	本教程介绍了如何设置铅OCR引擎在c# Windows控制台应用程序。
完成时间	30分钟
Visual Studio项目	下载教程项目(3 KB)
平台	c# Windows控制台应用程序
IDE	Visual Studio 2017中,2019年
开发许可	下载LEADTOOLS
试试用另一种语言	c#:net框架(控制台),net框架(WinForms),net框架(控制台) 苹果:macOS C API:C DLL (Windows) Java:Java

所需的知识

熟悉基本的步骤创建一个项目的审查添加引用和设置一个许可证教程,在工作之前将图像转换为可搜索PDF OCR - c#控制台教程。

创建项目并添加LEADTOOLS引用

从项目中创建的副本添加引用和设置一个许可证教程。如果你没有这个项目,按照这个教程中的步骤创建它。

的引用需要取决于项目的目的。引用可以通过添加一个或另一个下面的两种方法(但不是全部)。对于这个项目,还需要以下引用:

如果使用NuGet引用,本教程需要以下NuGet包:

Leadtools.Ocr

如果使用本地DLL的引用,下面的DLL是必要的。dll位于< INSTALL_DIR > \ LEADTOOLS22 \ Bin \ Dotnet4 \ x64:

Leadtools.dll
Leadtools.Codecs.dll
Leadtools.Codecs.Cmp.dll
Leadtools.Codecs.Tif.dll
Leadtools.Codecs.Fax.dll
Leadtools.Document.Writer.dll
Leadtools.Ocr.dll
Leadtools.Ocr.LEADEngine.dll

对于一个完整的列表的应用程序所需的DLL文件,请参考文件包含在您的应用程序。

设置许可文件

许可解锁项目需要的特性。它必须设置工具箱函数被调用之前。细节包括教程不同的平台,请参考设置一个运行时许可。

有两种类型的运行时许可证:

评估许可,评估工具包时下载获得。它允许评估工具包。
部署许可证。如果部署许可证文件和开发人员的关键是需要的,请参考获得许可证。

请注意

添加LEADTOOLS NuGet和本地引用设置许可中会详细介绍添加引用和设置一个许可证教程。

添加OCR的代码

与项目创建、添加引用,许可,可以开始编码。

在解决方案资源管理器,打开Program.cs。初始化和运行OCR引擎,添加一个新的inputFile OCR(字符串,字符串outputFile)方法,称之为内部主要方法。

添加以下语句的使用块的顶部Program.cs:

使用Leadtools;
使用Leadtools.Ocr;
使用Leadtools.Document.Writer;

/ /使用块使用系统;使用先;使用Leadtools;使用Leadtools.Document.Writer;使用Leadtools.Ocr;使用Leadtools.Document;

静态无效OCR (字符串inputFile,字符串outputFile){使用(IOcrEngine ocrEngine = OcrEngineManager.CreateEngine (OcrEngineType.LEAD)){/ /启动LEADTOOLS OCR引擎ocrEngine.Startup (零,零,零,@“C: \ LEADTOOLS22 \ Bin \常见\ OcrLEADRuntime”);/ /运行AutoRecognizeManager并指定PDF格式ocrEngine.AutoRecognizeManager。运行(inputFile outputFile DocumentFormat.Pdf,零,零);Console.WriteLine ($“OCR输出保存到{outputFile}”);}}

静态无效主要(字符串[]参数){SetLicense ();字符串输入=@“C: \ LEADTOOLS22 \资源\ \ OCR1.TIF图像”;字符串输出=@“C: \ LEADTOOLS22 \资源\ \ OCR1.PDF图像”;OCR(输入、输出);}

处理流

使用MemoryStream文件,替换现有的代码OCR ()用以下方法:

静态无效OCR (字符串inputFile,字符串outputFile){使用(IOcrEngine ocrEngine = OcrEngineManager.CreateEngine (OcrEngineType.LEAD)){使用(var流= File.OpenRead (inputFile)){var选择=新LoadDocumentOptions ();使用(var文档= DocumentFactory。LoadFromStream(流、期权)){/ /控制台命令检查文件加载正确翻倍Console.WriteLine (document.DocumentId);Console.WriteLine (document.DocumentId);Console.WriteLine (“文档加载”);/ /启动LEADTOOLS OCR引擎ocrEngine.Startup (零,零,零,@“C: \ LEADTOOLS22 \ Bin \常见\ OcrLEADRuntime”);/ /运行AutoRecognizeManager并指定PDF格式ocrEngine.AutoRecognizeManager。运行(inputFile outputFile DocumentFormat.Pdf,零,零);Console.WriteLine ($“OCR输出保存到{outputFile}”);}}}}

运行该项目

按运行项目F5,或通过选择调试- >开始调试。

如果步骤正确,控制台出现并确认许可被正确设置。然后应用程序转换OCR1。TIF图像以PDF格式并保存到指定位置(如搜索PDF)。

总结

本教程展示了如何创建一个简单的控制台的OCR应用程序初始化铅OCR引擎,需要指定输入文件和输出识别结果以指定的格式指定的输出文件。

另请参阅

下载我们的免费评估

帮助22.0.2022.12.22版本

LEADTOOLS教程

开始使用LEADTOOLS安装程序

net 6 +

net框架

安卓

C DLL

云服务

码头工人

HTML5

iOS

Java

macOS

Xamarin的