获取此页的文本内容。
公共DocumentPageTextGetText ()
公共函数GetText ()作为DocumentPageText
公共:
DocumentPageText^ GetText ()
公共DocumentPageText getText ()
文字内容本DocumentPage作为一个DocumentPageText对象。
GetText用于解析页面的文本内容。所有文档类型都支持此方法,并在内部使用LEADTOOLS SVG或OCR引擎从文档中获取文本。
SetText用于替换页面的文本内容。IsTextModified用于作为标志,指示该页的文本已被用户替换。
该方法的工作原理如下(“item”为文本内容):
如果在缓存中找到一个项,它将立即返回。如果文档是使用缓存系统创建的,这是可用的。而且LEADDocument。CacheOptions包含DocumentCacheOptions。PageText.
的价值DocumentImages。IsSvgSupported而且DocumentText。文本ExtractionMode将确定是否使用LEADTOOLS SVG或OCR引擎从页面解析文本。
如果支持SVG,那么GetSvg并直接从SVG内容解析文本,而不使用OCR。
否则,如果OCR是支持的,那么GetImage,然后使用OCR从光栅图像中解析文本。
如果本文档使用缓存系统(LEADDocument。HasCache是真正的),然后DocumentPageText对象在返回之前保存到缓存中。下次调用此方法时,将直接从缓存返回文本,而不需要再次解析。
当的值DocumentText。AutoParseLinks是真正的并且页面文本首先使用GetText,那么文档也会尝试根据存储的正则表达式来解析文本中的链接LinkPatterns.
注意,如果SetText之前被称为零对象的文本参数,则该方法将返回零也
在所有情况下,归来者DocumentPageText对象未被此对象使用LEADDocument在它被归还之后。
LEADTOOLS文档查看器使用此方法获取用于所有文本操作(如查找、选择文本和文本审查注释对象)的文本。
有关更多信息,请参阅使用文档库解析文本.
使用Leadtools;
使用Leadtools.Codecs;
使用Leadtools.Document.Writer;
使用Leadtools.Document;
使用Leadtools.Caching;
使用Leadtools.Annotations.Engine;
使用Leadtools.Ocr;
使用Leadtools.Barcode;
使用Leadtools.Document.Converter;
公共无效DocumentPageGetTextExample ()
{
var选择=新LoadDocumentOptions ();
使用(vardocument = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir,“Leadtools.tif”),选择)
{
//对于TIF文件我们需要一个OCR引擎
varocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead);
varrasterCodecs =新RasterCodecs ();
vardocumentWriter =新DocumentWriter ();
ocrEngine。启动(rasterCodecs documentWriter,零, LEAD_VARS.OcrLEADRuntimeDir);
document.Text.OcrEngine = ocrEngine;
//获取文本
varpage = document.Pages[0];
varpageText = page.GetText();
如果(pageText ! =零)
{
pageText.BuildText ();
vartext = pageText.Text;
Console.WriteLine(文本);
}
其他的
{
控制台。WriteLine (“没有!”);
}
}
}
静态类LEAD_VARS
{
公共常量字符串ImagesDir =@“C: \ LEADTOOLS21 \ Resources \图片”;
公共常量字符串OcrLEADRuntimeDir =@“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”;
}
进口Leadtools
进口Leadtools。编解码器
进口Leadtools.Document.Writer
进口Leadtools.Svg
进口Leadtools。文档
进口Leadtools。缓存
进口Leadtools.Annotations.Engine
进口Leadtools。条形码
进口Leadtools。光学字符识别
进口LeadtoolsDocumentExamples.LeadtoolsExamples.Common
进口Leadtools.Document.Converter
公共共享子DocumentPageGetTextExample ()
昏暗的选项作为新LoadDocumentOptions ()
使用文档作为Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path,“Leadtools.tif”),选择)
’对于TIF文件,我们需要一个OCR引擎
昏暗的ocrEngine作为IOcrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead)
昏暗的rasterCodecs作为新RasterCodecs ()
昏暗的documentWriter作为新DocumentWriter ()
ocrEngine。启动(rasterCodecs documentWriter,没有什么LEAD_VARS.OcrLEADRuntimeDir)
document.Text.OcrEngine = ocrEngine
'获取文本
昏暗的页面作为Leadtools.Document.DocumentPage = document.Pages(0)
昏暗的pageText作为DocumentPageText = page.GetText()
如果不pageText是没有什么然后
pageText.BuildText ()
昏暗的文本作为字符串= pageText。文本
Console.WriteLine(文本)
其他的
控制台。WriteLine (“没有!”)
结束如果
结束使用
结束子
公共NotInheritable类LEAD_VARS
公共常量OcrLEADRuntimeDir作为字符串=“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”
结束类
帮助收藏
光栅net|C API|c++类库|HTML5 JavaScript
文档net|C API|c++类库|HTML5 JavaScript
医疗net|C API|c++类库|HTML5 JavaScript
医疗网络查看器net
188宝金博怎么下载
支持的平台上
.NET、Java、Android和iOS/macOS程序集
C API/ c++类库
HTML5 JavaScript库
您的邮件已发送给技术支持!应该有人联系!如果你的事情很紧急,请回来聊天。
聊天时间:
周一至周五,美国东部时间上午8:30至下午6:00
感谢您的反馈!
请再次填写表格,开始新的聊天。
所有代理目前都离线。
聊天时间:
星期一至星期五
美国东部时间上午8:30 -下午6点
如需与我们联系,请填写此表格,我们将通过电子邮件与您联系。