←选择平台

GetText()方法

总结

获取此页的文本内容。

语法
c#
VB
c++
Java
公共DocumentPageTextGetText ()
公共函数GetText ()作为DocumentPageText
公共DocumentPageText^ GetText ()
公共DocumentPageText getText ()

返回值

文字内容本DocumentPage作为一个DocumentPageText对象。

讲话

GetText用于解析页面的文本内容。所有文档类型都支持此方法,并在内部使用LEADTOOLS SVG或OCR引擎从文档中获取文本。

SetText用于替换页面的文本内容。IsTextModified用于作为标志,指示该页的文本已被用户替换。

该方法的工作原理如下(“item”为文本内容):

  1. 如果在缓存中找到一个项,它将立即返回。如果文档是使用缓存系统创建的,这是可用的。而且LEADDocument。CacheOptions包含DocumentCacheOptions。PageText

  2. 的价值DocumentImages。IsSvgSupported而且DocumentText。文本ExtractionMode将确定是否使用LEADTOOLS SVG或OCR引擎从页面解析文本。

  3. 如果支持SVG,那么GetSvg并直接从SVG内容解析文本,而不使用OCR。

  4. 否则,如果OCR是支持的,那么GetImage,然后使用OCR从光栅图像中解析文本。

  5. 如果本文档使用缓存系统(LEADDocument。HasCache真正的),然后DocumentPageText对象在返回之前保存到缓存中。下次调用此方法时,将直接从缓存返回文本,而不需要再次解析。

当的值DocumentText。AutoParseLinks真正的并且页面文本首先使用GetText,那么文档也会尝试根据存储的正则表达式来解析文本中的链接LinkPatterns

注意,如果SetText之前被称为对象的文本参数,则该方法将返回

在所有情况下,归来者DocumentPageText对象未被此对象使用LEADDocument在它被归还之后。

LEADTOOLS文档查看器使用此方法获取用于所有文本操作(如查找、选择文本和文本审查注释对象)的文本。

有关更多信息,请参阅使用文档库解析文本

例子
c#
VB
使用Leadtools;使用Leadtools.Codecs;使用Leadtools.Document.Writer;使用Leadtools.Document;使用Leadtools.Caching;使用Leadtools.Annotations.Engine;使用Leadtools.Ocr;使用Leadtools.Barcode;使用Leadtools.Document.Converter;公共无效DocumentPageGetTextExample ()var选择=LoadDocumentOptions ();使用vardocument = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir,“Leadtools.tif”),选择)//对于TIF文件我们需要一个OCR引擎varocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead);varrasterCodecs =RasterCodecs ();vardocumentWriter =DocumentWriter ();ocrEngine。启动(rasterCodecs documentWriter,, LEAD_VARS.OcrLEADRuntimeDir);document.Text.OcrEngine = ocrEngine;//获取文本varpage = document.Pages[0];varpageText = page.GetText();如果(pageText ! =pageText.BuildText ();vartext = pageText.Text;Console.WriteLine(文本);其他的控制台。WriteLine (“没有!”);静态LEAD_VARS公共常量字符串ImagesDir =@“C: \ LEADTOOLS21 \ Resources \图片”公共常量字符串OcrLEADRuntimeDir =@“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”
进口Leadtools进口Leadtools。编解码器进口Leadtools.Document.Writer进口Leadtools.Svg进口Leadtools。文档进口Leadtools。缓存进口Leadtools.Annotations.Engine进口Leadtools。条形码进口Leadtools。光学字符识别进口LeadtoolsDocumentExamples.LeadtoolsExamples.Common进口Leadtools.Document.Converter公共共享DocumentPageGetTextExample ()昏暗的选项作为LoadDocumentOptions ()使用文档作为Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path,“Leadtools.tif”),选择)’对于TIF文件,我们需要一个OCR引擎昏暗的ocrEngine作为IOcrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead)昏暗的rasterCodecs作为RasterCodecs ()昏暗的documentWriter作为DocumentWriter ()ocrEngine。启动(rasterCodecs documentWriter,没有什么LEAD_VARS.OcrLEADRuntimeDir)document.Text.OcrEngine = ocrEngine'获取文本昏暗的页面作为Leadtools.Document.DocumentPage = document.Pages(0)昏暗的pageText作为DocumentPageText = page.GetText()如果pageText没有什么然后pageText.BuildText ()昏暗的文本作为字符串= pageText。文本Console.WriteLine(文本)其他的控制台。WriteLine (“没有!”结束如果结束使用结束公共NotInheritableLEAD_VARS公共常量OcrLEADRuntimeDir作为字符串“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”结束
需求
目标平台
Leadtools。文档作为sembly
188金宝搏的网址客服|支持|联系我们|知识产权公告
©1991 - 2021领德科技有限公司版权所有。