结构体L_OcrCharacter
{
L_UINTStructSize;
L_WCHAR代码;
L_WCHARGuessCode1;
L_WCHARGuessCode2;
L_WCHARReserved2;
L_UINT信心;
L_BOOLWordIsCertain;
L_RECT界限;
L_OcrCharacterPositions位置;
L_INT基地;
L_UINTCellIndex;
L_UINTLeadingSpaces;
L_UINTLeadingSpacesConfidence;
L_FLOAT字形大小;
L_OcrCharacterFontStylesFontStyles;
L_COLORREF颜色;
L_OcrLanguage语言;
L_UINT16RotationAngle;
L_UINT16保留;
L_UCHAREngineData [16];
};
类型定义结构体L_OcrCharacter L_OcrCharacter;
表示可识别的字符数据。
成员 | 描述 |
---|---|
StructSize | 结构尺寸。它应该等于sizeof(L_OcrCharacter)。 |
代码 | 获取或设置字符的代码(值)。 |
GuessCode1 | 获取或设置识别的第一个猜测(如果有的话)。 |
GuessCode2 | 获取或设置识别的第二次猜测(如果有的话)。 |
Reserved2 | 保留以备将来使用。 |
信心 | 获取或设置表示第一个猜测的识别确定性的置信数。 |
WordIsCertain | 获取或设置一个值,该值指示此字符所属的单词是否已通过拼写检查。 |
界限 | 获取或设置正好包含字符的矩形的坐标。 |
职位 | 获取或设置字符的位置信息。有关可能值的列表,请参见L_OcrCharacterPositions. |
基地 | 获取或设置基线的Y坐标的长度,该Y坐标从确切包含字符的矩形的上边缘开始测量。 |
CellIndex | 获取或设置表中包含此字符的单元格的索引。 |
LeadingSpaces | 获取或设置字符前前导空格的估计数目。 |
LeadingSpacesConfidence | 获取或设置表示此字符前前导空格数目的确定性的置信数。 |
字形大小 | 获取或设置字符的字体大小(以点为单位)。 |
FontStyles | 获取或设置字符的字体属性。 |
颜色 | 获取或设置字符的颜色。 |
语言 | 获取或设置字符所属的语言。有关可能值的列表,请参见L_OcrLanguage. |
RotationAngle | 获取或设置字符的旋转角度。正值表示逆时针旋转。 |
保留 | 保留,供内部使用。 |
EngineData | 供内部使用。 |
要获取页面的可识别字符,请调用L_OcrPage_GetRecognizedCharacters后L_OcrPage_Recognize.
若要更新页面的可识别字符,请调用L_OcrPage_SetRecognizedCharacters在调用之前L_OcrDocument_Save或L_OcrDocument_SaveXml.
L_OcrPageCharacters包含区域的字符列表。
L_OcrZoneCharacters包含特定区域的字符列表。
L_OcrCharacter是关于已识别字符的最详细信息。
触摸字符,即其形状在传递给OCR引擎的页面中物理连接的字符,将为块中的每个识别字符生成单独的L_OcrCharacter结构。然而,这些字符的坐标属性(Bounds)将具有相同的坐标,为字符块定义一个矩形边界。表示字符块的L_OcrCharacter结构的顺序给出了原始文档中涉及字符的顺序。这意味着坐标不会给出边界块内字符顺序的信息。
这种结构用于内部L_OcrZoneCharacters结构,该结构又用于L_OcrPageCharacters它又被以下函数使用:
L_OcrPage_GetRecognizedCharacters