←选择平台

DocumentText类

总结

管理文档的文本选项。

语法
c#
VB
c++
Java
[DataContractAttribute ()]公共DocumentText
< DataContractAttribute () >公共DocumentText
公共(DataContractAttribute)ref类DocumentText
公共DocumentText实现了可序列化的
讲话

DocumentText控件来管理文档的文本,并可以通过文本的属性LEADDocument

方法提取文档页面的文本DocumentPage。GetText方法。这将返回一个DocumentPageText实例,该实例包含在具有位置和大小属性的页中找到的文本字符。此外,DocumentPageText支持将单词或文本构建为字符串,以便于处理。

该框架可以使用SVG或OCR技术来提取文本数据。使用哪种方法可以控制使用TextExtractionMode财产。

有关更多信息,请参阅使用文档库解析文本

例子
c#
VB
使用Leadtools;使用Leadtools.Codecs;使用Leadtools.Document.Writer;使用Leadtools.Document;使用Leadtools.Caching;使用Leadtools.Annotations.Engine;使用Leadtools.Ocr;使用Leadtools.Barcode;使用Leadtools.Document.Converter;公共无效DocumentTextExample ()var选择=LoadDocumentOptions ();使用vardocument = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir,“Leadtools.tif”),选择)//对于TIF文件我们需要一个OCR引擎varocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead);varrasterCodecs =RasterCodecs ();vardocumentWriter =DocumentWriter ();ocrEngine。启动(rasterCodecs documentWriter,, LEAD_VARS.OcrLEADRuntimeDir);document.Text.OcrEngine = ocrEngine;//获取文本varpage = document.Pages[0];varpageText = page.GetText();如果(pageText ! =pageText.BuildText ();vartext = pageText.Text;Console.WriteLine(文本);}其他的控制台。WriteLine (“没有!”);}}}静态LEAD_VARS公共常量字符串ImagesDir =@“C: \ LEADTOOLS21 \ Resources \图片”公共常量字符串OcrLEADRuntimeDir =@“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”}
进口Leadtools进口Leadtools。编解码器进口Leadtools.Document.Writer进口Leadtools.Svg进口Leadtools。文档进口Leadtools。缓存进口Leadtools.Annotations.Engine进口Leadtools。条形码进口Leadtools。光学字符识别进口LeadtoolsDocumentExamples.LeadtoolsExamples.Common进口Leadtools.Document.Converter公共共享DocumentTextExample ()昏暗的选项作为LoadDocumentOptions ()使用文档作为Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path,“Leadtools.tif”),选择)’对于TIF文件,我们需要一个OCR引擎昏暗的ocrEngine作为IOcrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead)昏暗的rasterCodecs作为RasterCodecs ()昏暗的documentWriter作为DocumentWriter ()ocrEngine。启动(rasterCodecs documentWriter,没有什么LEAD_VARS.OcrLEADRuntimeDir)document.Text.OcrEngine = ocrEngine'获取文本昏暗的页面作为Leadtools.Document.DocumentPage = document.Pages(0)昏暗的pageText作为DocumentPageText = page.GetText()如果pageText没有什么然后pageText.BuildText ()昏暗的文本作为字符串= pageText。文本Console.WriteLine(文本)其他的控制台。WriteLine (“没有!”结束如果结束使用结束公共NotInheritableLEAD_VARS公共常量OcrLEADRuntimeDir作为字符串“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”结束
需求
目标平台
Leadtools。文档作为sembly
188金宝搏的网址客服|支持|联系我们|知识产权公告
©1991 - 2021领德科技有限公司版权所有。