本教程展示了如何设置光学字符识别处理和只有几将图像与手写文本搜索PDF C在Windows DLL程序使用LEADTOOLS SDK。
概述 | |
---|---|
总结 | 本教程介绍了如何识别手写的文本与图像在Windows C应用程序DLL。 |
完成时间 | 30分钟 |
Visual Studio项目 | 下载教程项目(19 KB) |
平台 | Windows C DLL应用程序 |
IDE | Visual Studio 2017中,2019年 |
开发许可 | 下载LEADTOOLS |
试试用另一种语言 |
|
熟悉创建一个项目的基本步骤和使用LEADTOOLS OCR技术通过审查添加引用和设置一个许可证和将图像转换为可搜索和OCR PDF教程,在工作之前识别手写文本的图像与ICR - C Windows DLL教程。
缩写光学字符识别;另外,定义为光学字符阅读器。为进一步细节LEADTOOLS支持这项技术,请参阅光学字符识别。
从项目中创建的副本将图像转换为可搜索和OCR PDF教程。如果项目不可用,按照这个教程中的步骤创建它。
利用LEADTOOLS OCR功能,添加所需的头文件和库文件。打开(预编译头文件pch.h
或stdafx.h
,取决于使用的版本的Visual Studio)并确保添加以下行。
# include“c: \ LEADTOOLS21 \ \ ltocr.h包括”
# pragma评论(自由,“C: \ \ LEADTOOLS21 \ \ Lib \ \ CDLL \ \ x64 \ \ Ltocr_x.lib”)/ / OCR的支持
请注意
dll的完整列表,需要特定的应用程序功能,参考文件包含在应用程序- C API。
许可解锁项目需要的特性。它之前必须设置工具箱功能。详情,包括教程为不同的平台,请参考设置一个运行时许可。
有两种类型的运行时许可证:
请注意
添加LEADTOOLS引用和设置许可中会详细介绍添加引用和设置一个许可证教程。
与项目创建、引用添加许可,和加载图像添加代码,代码就可以开始了。
这个项目已经实现了光学字符识别但需要修改来支持只有几。主要的修改是指定的类型光学字符识别区,只有几之前认识到文本。
在解决方案资源管理器,打开项目的CPP文件。导航到OcrAndSaveResult
功能,并添加以下代码行之前L_OcrPage_Recognize
函数调用。
SetIcrZone (ocrPage);/ /添加这一行
nRet = L_OcrPage_Recognize (ocrPage,空,空);
创建一个新的命名函数SetIcrZone (L_OcrPage handwrittenPage)
可以放在上面OcrAndSaveResult
函数。添加下面的代码来设置L_OcrZoneType
来只有几。
无效SetIcrZone (L_OcrPage handwrittenPage)
{
L_OcrZone ocrZone = {0};
ocrZone。StructSize =运算符ocrZone;
L_RECT r = {0, 0, BITMAPWIDTH (&LEADBmp) BITMAPHEIGHT (&LEADBmp)};
ocrZone。边界= r;
ocrZone。ZoneType = L_OcrZoneType_Icr;
ocrZone。背景色= RGB (255、255、255);
L_OcrPage_InsertZone (handwrittenPage 0 &ocrZone);
}
请注意
如果页面已经区,下面的代码可以用来改变他们的类型只有几
/ /选择使用这个函数代替SetIcrZone()如果页面已经区
无效ModifyExistingZonesToIcr (L_OcrPage handwrittenPage)
{
L_UINT uZones = 0;
L_OcrPage_GetZoneCount (handwrittenPage &uZones);
为(intnZone = 0;nZone < uZones;nZone + +)
{
L_OcrZone ocrZone = {0};
ocrZone。StructSize =运算符ocrZone;
L_OcrPage_GetZoneAt (handwrittenPage nZone &ocrZone);
ocrZone。ZoneType = L_OcrZoneType_Icr;
L_OcrPage_SetZoneAt (handwrittenPage nZone &ocrZone);
}
}
按运行项目F5,或通过选择调试- >开始调试。
如果是正确的步骤,应用程序应该运行,让用户选择文件>开放加载的文件只有几识别将会执行。
为了测试这个项目,扫描图像可以使用。选择光学字符识别>承认和导出结果应用程序运行只有几输入文件和输出到一个可搜索的PDF文件:C: \ Temp \ output.pdf
这是原始扫描文档的输出:输出PDF
本教程介绍了如何识别手写文本通过设置L_OcrZoneType
来只有几。