LEADTOOLS C API OCR Toolkit通过以下单独的组件支持语言和拼写检查:
语言环境
语言环境定义了OCR引擎所识别的字符集。例如,如果启用英语和德语,则德语字符(ä, Ä, é, ö, Ö, ü, Ü, ß)将与英语字符组合,以定义引擎识别的集合。
要设置要在引擎中使用的字符集,请使用L_OcrLanguageManager_EnableLanguages方法。要获得引擎支持的字符集,请使用L_OcrLanguageManager_GetSupportedLanguages而且L_OcrLanguageManager_IsLanguageSupported方法。您可以根据需要启用任意多的字符集。
语言环境不会自动执行拼写检查。要启用它,您需要使用拼写检查子系统。
拼写检查子系统
检查子系统的功能由三个独立的组件组成:
LEADTOOLS OCR支持通过使用外部字典进行拼写检查和更正。您可以通过调用来启用特定的拼写检查程序L_OcrSpellCheckManager_SetSpellCheckEngine这也是用来关闭拼写检查通过传递L_OcrSpellCheckEngine_None对于上述方法的第二个参数。
当你设置IOcrSpellCheckManager。属性的值不是None, OCR引擎将自动尝试加载所请求的拼写检查器,并查询在您的机器上找到的语言字典。的生命周期内,可以随时更改拼写检查引擎L_OcrEngine,视乎你的应用需要而定。例如,您可以在仅识别某些类型的文档时禁用拼写检查,然后对其他类型重新启用它。
要查询支持字典的语言,请使用L_OcrSpellCheckManager_GetSupportedLanguages.
引擎支持的语言字符集
引擎支持的语言字典
有关更多信息,请参阅L_OcrSpellCheckManager_SetSpellCheckEngine.