使用OCR页面

启动OCR引擎之后，就可以开始处理文档页面了。页面可以使用OCR文档，也可以不使用OCR文档。

当使用OCR页面时，LEADTOOLS OCR方法提供了对以下任务的支持:

中描述的使用LEADTOOLS OCR模块编程- LEAD引擎,一个L_OcrPage方法可以直接创建L_OcrPage_FromBitmap方法，而不使用L_OcrDocument句柄。这些页面可以分区和识别，OCR结果可以直接使用L_OcrPage_GetText或L_OcrPage_GetRecognizedCharacters．

如果要将页面保存为最终文档(如PDF或DOCX)，则将L_OcrDocument处理是必需的。

的一个实例L_OcrDocument句柄包含文档的页面。方法可以创建新的OCR文档L_OcrDocumentManager_CreateDocument方法。此方法允许创建基于内存或基于文件的文档。

每个OCR文件可有一页或多页(L_OcrPage处理)。L_OcrDocumentManager提供了一些可用于访问OCR文档页面的功能。

L_OcrDocument保存的列表L_OcrPage句柄。每一个L_OcrPagehandles包含用于创建它的位图句柄(加载或添加页面时使用的位图)和页面的一组OCR分区(手动添加或通过自动分区添加)。

L_OcrDocument如果文档是基于内存的，则提供一些功能来添加、删除、获取、设置和遍历文档的不同页面。

向基于文件的文档添加页面涉及对当前识别数据进行快照，并将其存储在内部。页面本身不会被添加到内部页面列表中，也不需要驻留在内存中。用户只能添加新页面，而不能删除或迭代它们。

的主要功能L_OcrDocument：

从位图句柄向文档添加新页。下表列出了所有OCR文档页面添加方法组:

价值	描述
L_OcrDocument_AddPage	添加对象的识别数据L_OcrPage一个文档。适用于基于文件和基于内存的文档。
L_OcrDocument_InsertPage	对象的识别数据L_OcrPage到文档单页上的特定位置。只适用于基于内存的文档。

对OCR识别执行高级的“发射后即忘记”方法，通过多线程支持L_OcrAutoRecognizeManager方法识别单个或多个文件，并将识别结果保存到具有单个函数的文件中L_OcrAutoRecognizeManager_Run，L_OcrAutoRecognizeManager_RunJob或L_OcrAutoRecognizeManager_RunJobAsync方法。

帮助21.0.2021.7.2版本

LEADTOOLS OCR模块- LEAD Engine C API帮助

简介

版本历史

LEADTOOLS OCR特性

快速参考

教程

函数引用