使用OCR页面

启动OCR引擎之后,就可以开始处理文档页面了。页面可以使用OCR文档,也可以不使用OCR文档。

当使用OCR页面时,LEADTOOLS OCR方法提供了对以下任务的支持:

中描述的使用LEADTOOLS OCR模块编程- LEAD引擎,一个L_OcrPage方法可以直接创建L_OcrPage_FromBitmap方法,而不使用L_OcrDocument句柄。这些页面可以分区和识别,OCR结果可以直接使用L_OcrPage_GetTextL_OcrPage_GetRecognizedCharacters

如果要将页面保存为最终文档(如PDF或DOCX),则将L_OcrDocument处理是必需的。

的一个实例L_OcrDocument句柄包含文档的页面。方法可以创建新的OCR文档L_OcrDocumentManager_CreateDocument方法。此方法允许创建基于内存或基于文件的文档。

每个OCR文件可有一页或多页(L_OcrPage处理)。L_OcrDocumentManager提供了一些可用于访问OCR文档页面的功能。

L_OcrDocument保存的列表L_OcrPage句柄。每一个L_OcrPagehandles包含用于创建它的位图句柄(加载或添加页面时使用的位图)和页面的一组OCR分区(手动添加或通过自动分区添加)。

L_OcrDocument如果文档是基于内存的,则提供一些功能来添加、删除、获取、设置和遍历文档的不同页面。

向基于文件的文档添加页面涉及对当前识别数据进行快照,并将其存储在内部。页面本身不会被添加到内部页面列表中,也不需要驻留在内存中。用户只能添加新页面,而不能删除或迭代它们。

的主要功能L_OcrDocument

从位图句柄向文档添加新页。下表列出了所有OCR文档页面添加方法组:

价值 描述
L_OcrDocument_AddPage 添加对象的识别数据L_OcrPage一个文档。适用于基于文件和基于内存的文档。
L_OcrDocument_InsertPage 对象的识别数据L_OcrPage到文档单页上的特定位置。只适用于基于内存的文档。

对OCR识别执行高级的“发射后即忘记”方法,通过多线程支持L_OcrAutoRecognizeManager方法识别单个或多个文件,并将识别结果保存到具有单个函数的文件中L_OcrAutoRecognizeManager_RunL_OcrAutoRecognizeManager_RunJobL_OcrAutoRecognizeManager_RunJobAsync方法。

LEADTOOLS OCR模块- LEAD Engine C API帮助
188金宝搏的网址客服|支持|联系我们|知识产权的通知
©1991 - 2021领先的技术公司。保留所有权利。