解析文本文档库

任何页面的文档类支持解析文本使用LEADTOOLS SVG或OCR技术。这允许应用程序执行操作,如全文搜索、突出显示文本文档,创建基于文本的注释审查对象。的LEADTOOLS文档查看器库和演示文档查看器就是这样一个例子。

文本可以解析两种方式中的一种:

最好使用SVG引擎提取文本数据准确性和最大速度的100%。如果SVG数据不可用,那么应该使用OCR。的LEADDocument类提供了支持时,执行上述的自动隐藏所有的内部细节。类将获得文本数据的用户以同样的方式不管SVG或使用OCR。

每页可以获得使用的文本GetText。这将返回一个DocumentPageText对象包含信息页面上的每个字符发现包括它的位置、大小和代码。这些信息统一无论SVG或使用OCR。类还包含辅助方法来组织这些角色的话,行,或一个简单的字符串对象。指DocumentPageText为更多的信息。

如果缓存使用的文档,那么随后的调用GetText将从缓存中获取数据,但它不是再次解析(加快操作)。

GetText被称为,LEADDocument对象将使用中设置的选项DocumentText确定如何解析文本。这些设置文本财产和所有文档的页面是全球性的。这些设置包括:

LEADTOOLS OCR和SVG技术是完全线程安全的和任意数量的页面可以解析从任何数量的线程在同一时间。

例如,GetText

另请参阅

文档库的功能

文件查看器应用程序

使用LEADTOOLS加载文档文档库

创建文档LEADTOOLS文档库

文档工具包和缓存

使用文档库上传

文档库坐标系统

使用文档库加载加密的文件

条形码处理文档库

在文档库中使用jQuery的承诺

加载图片的文档库

文档页面转换

使用LEADTOOLS文档查看器

工作状态文档转换器

查看和转换编校文档

LEADTOOLS HTML5 JavaScript
188金宝搏的网址客服|支持|联系我们|知识产权的通知
©1991 - 2021领先的技术公司。保留所有权利。