铅工具OCR模块-铅引擎支持的设置如下:
类型:BeginCategory
范围和价值: N /
描述:识别设置类别的开始。
类型:BeginCategory
范围和价值: N /
描述:识别适配设置类别的开始。
类型:布尔
范围和价值: N /
描述:在这个版本的LEADTOOLS中没有使用
类型:EndCategory
范围和价值: N /
描述:识别适配设置类别的结束。
类型:BeginCategory
范围和价值: N /
描述:自动识别管理器类别的开始。
类型:枚举
范围和价值:没有一个
,肖像
,景观
描述:如果页面为空白或仅为图形,则生成文档的默认方向。可能的值是:
价值 | 意义 |
---|---|
没有一个 |
一定要改变方向。 |
肖像 |
如果页面为空或只包含图形,则尝试更改为纵向(使宽度小于高度)。 |
景观 |
如果页面是空的或只包含图形,则尝试更改为横向(使宽度大于高度)。 |
类型:布尔
范围和价值: N /
描述:可根据最终文档格式优化识别速度。例如,如果最终格式是文本,OCR引擎将无法识别斜体或粗体等字体属性。
类型:EndCategory
范围和价值: N /
描述:自动识别管理器类别的结束。
类型:布尔
范围和价值: N /
描述:如果第一次处理没有提供令人满意的结果,自动对内部B/W图像进行第二次图像处理清理。默认值为True。
类型:BeginCategory
范围和价值: N /
描述:识别字符过滤器类别的开始。
类型:布尔
范围和价值: N /
描述:忽略与噪声特征相似的已识别字符。
类型:整数
范围和价值: 0 ~ 2147483647
描述:以像素为单位的可识别字符的最小宽度。
类型:整数
范围和价值: 0 ~ 2147483647
描述:以像素为单位的可识别字符的最小高度。
类型:字符串
范围和价值:无最大值,可以为空
描述:从最小像素宽度和高度规则中排除的字符。
类型:布尔
范围和价值: N /
描述:如果该设置的值为True,则引擎将post处理任何MICR区域,丢弃所有不属于MICR字符集的字符、数字和符号,并对数据的有效性进行基本检查。默认值为True。
类型:EndCategory
范围和价值: N /
描述:识别字符过滤器类别的结束。
类型:布尔
范围和价值: N /
描述:自动检测每个字符的前景色和背景色。默认值为False。如果该值为True,则引擎将尝试自动检测区域的颜色L_OcrPage_AutoZone的前前色和BackColor成员中的值L_OcrZone结构。
类型:BeginCategory
范围和价值: N /
描述:字体类别的开头。
类型:布尔
范围和价值: N /
描述:真正的为每个识别的字符检测精确的边界矩形;否则,假.默认值为假.
类型:枚举
范围和价值:没有一个
,大胆的
,斜体
,下划线
,SansSerif
,衬线
,成比例的
,上标
,下标
,加删除线
描述:启用或禁用特定字体属性的检测。如果格式支持PDF或DOC等字体,这些标志将影响最终生成的文档。值可以设置为or。可能的值是:
价值 | 意义 |
---|---|
没有一个 |
不检测任何字体样式。 |
大胆的 |
检测粗体字体样式。 |
斜体 |
检测斜体字体样式。 |
下划线 |
检测下划线字体样式。 |
SansSerif |
检测无衬线字体样式(如Arial)。 |
衬线 |
检测衬线字体样式(如Times New Roman)。 |
成比例的 |
检测比例字体样式(如Times New Roman或Arial)或固定空格字体样式(如Courier New)。 |
上标 |
检测上脚本字体样式。 |
下标 |
检测下标字体样式。 |
加删除线 |
检测删除字体样式。 |
类型:布尔
范围和价值: N /
描述:启用大写/大写字体识别增强功能。
类型:布尔
范围和价值: N /
描述:启用字体属性识别。禁用它可以提高速度L_OcrPage_Recognize方法。
类型:EndCategory
范围和价值: N /
描述:字体类别的结束。
类型:BeginCategory
范围和价值: N /
描述:预处理设置类别的开始。
类型:枚举
范围和价值:默认的
,动态
,用户
描述:此设置将影响存储在引擎中的非B/W图像如何转换为B/W图像。这影响灰度或24位彩色图像,将在引擎的内存中创建B/W图像。
价值 | 意义 |
---|---|
默认的 |
图像二值化采用一种自动自适应阈值算法。 |
动态 |
每个像素与一个动态计算的阈值进行比较,如果像素强度较高,则设置为白色,否则设置为黑色。 |
用户 |
使用用户定义的阈值设置阈值Recognition.Preprocess.BlackWhiteImageConversionThreshold 设置。 |
类型:整数
范围和价值取值范围:0 ~ 255
描述:将彩色图像转换为双(黑/白)以准备识别图像上的文本时使用的阈值。转换是为了将文本强度从背景强度中分离出来。
这相当于在图像上调用L_IntensityDetectBitmap,其中crInColor等于检测到的前景色(文本)颜色,crOutColor等于检测到的背景颜色,uChannel为IDB_CHANNEL_MASTER, uHigh等于255,uLow等于这个设置的值。缺省值是185。
类型:布尔
范围和价值: N /
描述:对识别前的大图像进行采样;否则,假的。将该设置的值设置为true,以强制OCR引擎不创建大于4000 × 4000像素的处理图像(用于识别的图像),以保留内存和资源。如果MobileImagePreprocess设置的值为true,则忽略此值。
类型:整数
范围和价值取值范围:0 ~ 100
描述所使用的:L_OcrPage_AutoPreprocess确定定位页面时要使用的最小置信度百分比阈值。缺省值为26。
类型:布尔
范围和价值: N /
描述: True,启用移动图像处理模式;否则,假的。默认情况下,OCR引擎将尝试用低分辨率(DPI)提升图像。
然而,在大多数移动设备中,相机将拍摄低分辨率(例如,72 DPI)和大尺寸像素的照片。因此,让OCR引擎升级图像将导致不必要的内存消耗。
如果您正在使用OCR引擎处理来自移动相机的图像,请将该设置的值设置为false。
类型:枚举
范围和价值:没有一个
,抗扭斜
,旋转
,反
描述:当修改时,修改原始图像的方式IOcrPage。AutoPreprocess
.默认值是抗扭斜
|旋转
|反
.
价值 | 描述 |
---|---|
没有一个 |
永远不要修改原始图像 |
抗扭斜 |
应用在倾斜时发现的任何角度(L_OcrPage_GetDeskewAngle)在原图上 |
旋转 |
应用在执行自动定向时找到的角度(总是一个直角)L_OcrPage_GetRotateAngle)在原始图像上(自动定向) |
反 |
应用反转值(L_OcrPage_IsInverted)在原图上 |
当保存带有图像优于文本选项的文档时(例如PDF支持的选项),这些选项非常有用。在这种情况下,最好是覆盖原始图像,而不进行任何可能影响大小的修改。
在这种情况下,唯一的选择就是旋转
.Leadtools.Ocr.IOcrAutoRecognizeManager
如果最终文档格式支持图像优于文本,则会自动将此设置值设置为“旋转”。
类型:布尔
范围和价值: N /
描述:使用分区引擎从预处理计算(如deskew和auto-rotate)中排除图形区域是正确的。否则;假的。
类型:EndCategory
范围和价值: N /
描述:预处理设置类别的结束。
类型:整数
范围和价值: 0 ~ 2147483647
描述:L_OcrAutoRecognizeManager支持直接从磁盘文件加载位图句柄对象。加载的位图句柄保存原始图像,只有在保存图形区域或文本覆盖图像时才有用。
如果该图像的大小很大,并且是使用常规内存创建的,那么进程将使用大量的物理内存保存该图像,而不会将其用于其他目的,如自动分区或识别。这在多线程应用程序中更加明显,因为在常规内存中加载多个大图像会导致正常情况下应该成功的操作出现内存外错误。
L_OcrEngine如果内存中的图像的大小超过了在“MaximumPageConventionalMemorySize”中设置的预定值,可以自动切换到使用BITMAPHANDLE的磁盘内存特性。
"MaximumPageConventionalMemorySize"的单位是KBytes, x86默认值是42984 (42MBytes), x64默认值是429840 (420MBytes)。这个值允许传统内存中保存一个典型的OCR图像,大小为8.5 × 11英寸,300dpi,每像素32位,但任何明显大于该值的图像都可以使用磁盘内存模式。自然地,使用磁盘内存比使用传统内存要慢。
准确的比例取决于机器硬盘驱动器的速度。另外,使用磁盘内存最终可能会加快整体进程,因为释放物理内存会增加其他操作(如自动分区和识别)的性能,而加载操作虽然肯定会较慢,但可能不会占用总体时间的大部分。
具体设置的值取决于系统硬件配置、内核数量和应用类型。如果在应用程序中出现内存错误,您应该尝试更改此值。
类型:布尔
范围和价值: N /
描述: True表示识别后修改处理图像;否则,假的。最好将该设置的值设置为TrueL_OcrPage_Recognize每页只调用一次。L_OcrAutoRecognizeManager将在执行识别作业时临时将该设置的值设置为True。
类型:枚举
范围和价值:准确的
,平衡
,快
描述:识别模块在速度和精度之间的权衡。默认值为“均衡”。
类型:BeginCategory
范围和价值: N /描述:识别线程设置类别的开始。
类型:EndCategory
范围和价值: N /
描述:识别线程设置类别的结束。
类型:整数
范围和价值: 0 ~ 2147483647
描述:获取或设置要在识别中使用的最大线程数。LEADTOOLS OCR模块- LEAD引擎支持在独立的线程中识别文档区域。
这样可以提高性能L_OcrPage_Recognize方法。默认值0(0)指示LEADTOOLS使用系统线程池。
如果您不希望在L_OcrPage_Recognize方法,然后将Recognition.Threading.MaximumThreads的值设置为1。任何其他值都被视为0(使用线程池)。
类型:BeginCategory
范围和价值: N /
描述:单词识别设置类别的开始。
类型:EndCategory
范围和价值: N /
描述:单词识别设置类别的结束。
类型:布尔
范围和价值: N /
描述:此设置控制输出。如果为True,则在将识别结果保存为任何LEADTOOLS支持的文档格式时,将不包括评级较低的单词/字符(垃圾单词/字符)。
类型:布尔
范围和价值: N /
描述:此设置控制输出。如果为True,引擎将检查区域中的所有单词/字符。如果确定总体置信度和字符类型构成噪声,则丢弃整个区域识别结果。默认值为False。
类型:整数
范围和价值取值范围:0 ~ 100
描述:丢弃置信度值小于此值的任何单词。此设置仅在DiscardLowConfidenceWords为true时生效。
类型:BeginCategory
范围和价值: N /
描述: zoning设置类别的开始。
类型:EndCategory
范围和价值: N /
描述: zoning设置类别的结束。
类型:枚举
范围和价值:无,检测文本,检测图形,检测表,允许重叠,检测精确区域,使用文本提取器,检测复选框。这些标志影响IOcrPage的方式。AutoZone方法。值可以设置为or。可能的值是:描述:参见下表成员描述。
价值 | 意义 |
---|---|
没有一个 | 如果这是唯一设置的标志,引擎将使用默认值来执行自动分区。 |
检测文本 | 搜索页面图像内的文本区域。 |
检测图像 | 搜索页面图像内的图形区域。 |
检测表 | 在页面图像中搜索表区域。 |
允许重叠 | 允许区域重叠;否则,检测到的区域将不会重叠。 |
检测准确的区域 | 检测更小和更准确的区域(如页面段落)。除非设置了这个标志,否则自动区域算法将尝试检测最大的可能区域。 |
识别一个单元表 | 检测只有一个单元格作为表的表。必须用“检测表”或 |
将单元格作为区域 | 将表中检测到的每个单元格视为自己的区域。如果设置了此选项,则区域类型将为L_OcrZoneType_Text而不是L_OcrZoneType_Table。必须用“检测表”加OR。 |
使用高级表检测 | 当文档包含表时,使用高级表检测以获得最准确的结果。该选项将递归和主动解析文档,以定位表和单元格的位置。使用此选项将在最终输出中生成原始文档及其表的最精确表示。该选项必须与“检测表”或。 |
使用文本提取器 | 改进文本区域识别,通过从文本区域中分离图形和表格来提取文本。 |
检测复选框 | 在页面图像内搜索复选框区域。 |
类型:布尔
范围和价值: N /
描述: True在执行自动分区时禁用多线程;否则将启用多线程。多线程增强了自动分区算法的性能。但是,如果OCR引擎驻留在服务器中,则可能不希望这样做。
类型:布尔
范围和价值: N /
描述:如果该标志设置为true,那么LEAD引擎将从原始图像中裁剪每个区域并识别它。这样可以提高性能L_OcrPage_Recognize方法。
类型:布尔
范围和价值: N /
描述:如果该值设置为True,那么引擎将尝试为每个区域检测一个单独的旋转角度。默认值为False。
类型:布尔
范围和价值: N /
描述:如果该标志设置为true,则LEAD引擎将对每个文本区域执行第二次内部自动分区,以生成更多同质区域进行识别。这样可以提高性能L_OcrPage_Recognize方法。
类型:EndCategory
范围和价值: N /
描述:识别设置类别的结束。
类型:BeginCategory
范围和价值: N /
描述:拼写检查器类别的开始。
类型:整数
范围和价值取值范围:0 ~ 255
描述:获取或设置要同时使用的拼写检查程序的最大数量。默认值是系统中可用字典的数量。
类型:EndCategory
范围和价值: N /
描述:拼写检查器类别的结束。