管理文档的文本选项。
[DataContractAttribute ()]
公共类DocumentText
< DataContractAttribute () >
公共类DocumentText
公共(DataContractAttribute)
ref类DocumentText
公共类DocumentText实现了可序列化的
DocumentText控件来管理文档的文本,并可以通过文本的属性LEADDocument.
方法提取文档页面的文本DocumentPage。GetText方法。这将返回一个DocumentPageText实例,该实例包含在具有位置和大小属性的页中找到的文本字符。此外,DocumentPageText支持将单词或文本构建为字符串,以便于处理。
该框架可以使用SVG或OCR技术来提取文本数据。使用哪种方法可以控制使用TextExtractionMode财产。
有关更多信息,请参阅使用文档库解析文本.
使用Leadtools;
使用Leadtools.Codecs;
使用Leadtools.Document.Writer;
使用Leadtools.Document;
使用Leadtools.Caching;
使用Leadtools.Annotations.Engine;
使用Leadtools.Ocr;
使用Leadtools.Barcode;
使用Leadtools.Document.Converter;
公共无效DocumentTextExample ()
{
var选择=新LoadDocumentOptions ();
使用(vardocument = DocumentFactory.LoadFromFile(Path.Combine(LEAD_VARS.ImagesDir,“Leadtools.tif”),选择)
{
//对于TIF文件我们需要一个OCR引擎
varocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead);
varrasterCodecs =新RasterCodecs ();
vardocumentWriter =新DocumentWriter ();
ocrEngine。启动(rasterCodecs documentWriter,零, LEAD_VARS.OcrLEADRuntimeDir);
document.Text.OcrEngine = ocrEngine;
//获取文本
varpage = document.Pages[0];
varpageText = page.GetText();
如果(pageText ! =零)
{
pageText.BuildText ();
vartext = pageText.Text;
Console.WriteLine(文本);
}
其他的
{
控制台。WriteLine (“没有!”);
}
}
}
静态类LEAD_VARS
{
公共常量字符串ImagesDir =@“C: \ LEADTOOLS21 \ Resources \图片”;
公共常量字符串OcrLEADRuntimeDir =@“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”;
}
进口Leadtools
进口Leadtools。编解码器
进口Leadtools.Document.Writer
进口Leadtools.Svg
进口Leadtools。文档
进口Leadtools。缓存
进口Leadtools.Annotations.Engine
进口Leadtools。条形码
进口Leadtools。光学字符识别
进口LeadtoolsDocumentExamples.LeadtoolsExamples.Common
进口Leadtools.Document.Converter
公共共享子DocumentTextExample ()
昏暗的选项作为新LoadDocumentOptions ()
使用文档作为Leadtools.Document.LEADDocument = DocumentFactory.LoadFromFile(Path.Combine(ImagesPath.Path,“Leadtools.tif”),选择)
’对于TIF文件,我们需要一个OCR引擎
昏暗的ocrEngine作为IOcrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead)
昏暗的rasterCodecs作为新RasterCodecs ()
昏暗的documentWriter作为新DocumentWriter ()
ocrEngine。启动(rasterCodecs documentWriter,没有什么LEAD_VARS.OcrLEADRuntimeDir)
document.Text.OcrEngine = ocrEngine
'获取文本
昏暗的页面作为Leadtools.Document.DocumentPage = document.Pages(0)
昏暗的pageText作为DocumentPageText = page.GetText()
如果不pageText是没有什么然后
pageText.BuildText ()
昏暗的文本作为字符串= pageText。文本
Console.WriteLine(文本)
其他的
控制台。WriteLine (“没有!”)
结束如果
结束使用
结束子
公共NotInheritable类LEAD_VARS
公共常量OcrLEADRuntimeDir作为字符串=“C: \ LEADTOOLS21 \ Bin \常见\ OcrLEADRuntime”
结束类
帮助收藏
光栅net|C API|c++类库|HTML5 JavaScript
文档net|C API|c++类库|HTML5 JavaScript
医疗net|C API|c++类库|HTML5 JavaScript
医疗网络查看器net
188宝金博怎么下载
支持的平台上
.NET、Java、Android和iOS/macOS程序集
C API/ c++类库
HTML5 JavaScript库
您的邮件已发送给技术支持!应该有人联系!如果你的事情很紧急,请回来聊天。
聊天时间:
周一至周五,美国东部时间上午8:30至下午6:00
感谢您的反馈!
请再次填写表格,开始新的聊天。
所有代理目前都离线。
聊天时间:
星期一至星期五
美国东部时间上午8:30 -下午6点
如需与我们联系,请填写此表格,我们将通过电子邮件与您联系。