在本主题▼

识别OCR页面

在开始识别过程之前，您可以修改以下属性:

Leadtools.Ocr.IOcrSpellCheckManager.SpellCheckEngine

的Leadtools.Ocr.IOcrSpellCheckManager.SpellCheckEngine将用于启用或禁用检查子系统，该子系统将用于验证。

设置了所有必要的识别选项后，可以通过调用来识别页面IOcrPage。识别．

识别完成后，可以获得识别的字符，识别结果可以保存到文件、. net流或内存中。

为特定页面识别的字符集合可以使用IOcrPage。GetRecognizedCharacters．方法可以检查此字符集合，甚至可以修改它并更新识别数据IOcrPage。SetRecognizedCharacters方法。

可以通过调用将识别结果保存到文件或.NET流中IOcrDocument。保存．此方法需要一个DocumentFormat参数指定要保存的文档格式的类型(PDF、DOC、TXT等)。LEADTOOLS .NET OCR使用Leadtools.Document.Writer程序集将OCR结果保存到输出文件。

除了文档编写者支持的各种格式外，识别结果还可以保存为XMLIOcrDocument。SaveXml．

的简单.NET字符串对象中也可以直接获得识别结果IOcrPage。GetText方法。

最后，要获取或设置识别过程中使用的特殊字符，请使用IOcrDocumentManager。RejectionSymbol以及相关的IOcrDocumentManager。MissingSymbol属性。