在本主题▼

识别OCR页面

在开始识别过程之前,您可以修改以下属性:

Leadtools.Ocr.IOcrSpellCheckManager.SpellCheckEngine将用于启用或禁用检查子系统,该子系统将用于验证。

设置了所有必要的识别选项后,可以通过调用来识别页面IOcrPage。识别

识别完成后,可以获得识别的字符,识别结果可以保存到文件、. net流或内存中。

为特定页面识别的字符集合可以使用IOcrPage。GetRecognizedCharacters.方法可以检查此字符集合,甚至可以修改它并更新识别数据IOcrPage。SetRecognizedCharacters方法。

可以通过调用将识别结果保存到文件或.NET流中IOcrDocument。保存.此方法需要一个DocumentFormat参数指定要保存的文档格式的类型(PDF、DOC、TXT等)。LEADTOOLS .NET OCR使用Leadtools.Document.Writer程序集将OCR结果保存到输出文件。

除了文档编写者支持的各种格式外,识别结果还可以保存为XMLIOcrDocument。SaveXml

的简单.NET字符串对象中也可以直接获得识别结果IOcrPage。GetText方法。

最后,要获取或设置识别过程中使用的特殊字符,请使用IOcrDocumentManager。RejectionSymbol以及相关的IOcrDocumentManager。MissingSymbol属性。

LEADTOOLS成像、医疗和文档
188金宝搏的网址客服|支持|联系我们|知识产权公告
©1991 - 2021领德科技有限公司版权所有。