专利的准确性和速度
LEAD的专利表单分类库提供的api可以在不到两秒的时间内从包含1000多个主表单的集合中识别表单。一旦分类,库就会实现特定于字段类型的AI和ML增强,从而提高准确性和速度。库可以处理同一表单中的垂直和水平文本,以及签名、图片、标识和指纹等表单构件。先进的表单对齐算法补偿了不同扫描仪和打印机带来的非线性变形,因此图书馆将以最大的准确性和速度处理客户的表单。这些库甚至可以处理页面无序的表单。
全面的报道
针对每个表单字段捕获的综合报告包括字符位置、大小、基线、字符属性(字尾、行尾和段尾)、字体属性(单空格、比例、衬线、无衬线、粗体、斜体、下划线和删除线)和识别精度置信度值。使用正则表达式语法进一步实现自动验证。知道工作中有LEADTOOLS表单识别和处理库,您会睡得很香。
智能文档分析器组件
的表单识别和处理更加高级LEADTOOLS文档分析器组件.Document Analyzer可以从基于文本的办公文档(DOC, DOCX, XLS, XLX), PDF和文档图像(JPG, TIFF, PNG PDF)中智能检测和提取数据,而不需要结构化布局。
这种智能数据提取会自动找到使用结构化和非结构化表单(如发票、报表、提单和收据)的关键短语(即使文件之间的布局完全不同)。此外,该组件执行深度分析,以进一步改进检测,确保没有遗漏任何内容,并找到所有感兴趣的数据。
由强大的计算机视觉库支持
表单识别和处理库在幕后自动使用这些api,但是如果需要执行特定的识别任务,您仍然可以访问它们。
光学字符识别图书馆
的OCR库是强大的,并增强了人工智能用于处理40种不同字符集的机器打印字符和数字。
只有几图书馆
的1188金宝搏亚洲 用于处理手写字符和数字。
有机磁共振图书馆
条码库
小库
预处理是至关重要的:图像清理
对表单捕获进行预处理对于确保识别的准确性和速度至关重要。LEADTOOLS已经有超过32年的历史,已经处理过无数的图像。LEADTOOLS库包括一个综合和健壮的图像处理功能集合来清理文档图像,以提高识别速度和准确性.一些例子包括自动定位和对准,边界删除,孔冲孔删除,工作台线下降,倾斜和梯形效应删除,等等。捕获的形式可以是双向的或彩色的;LEADTOOLS可以处理所有这些问题。
模板||否模板:选择权在你
虽然LEADTOOLS表单识别SDK足够智能,可以在没有预定义的主表单的情况下处理表单,但有时识别应该局限于特定的表单布局或需要预定义的表单分类。为此,LEADTOOLS表单识别库包含了使主表单生成快速而简单的组件。在空表单中扫描,使用自动omr标记检测和批量字段重命名工具,输入所需的任何其他信息,并将主表单添加到适当的类别/子类别存储库中以供使用。
易于集成
LEADTOOLS处理了繁重的工作,省去了数月的研发时间,同时为您提供了最佳的质量和性能。您可以自由地专注于应用程序的其他组件。下载LEADTOOLS评估简化开发流程。
使用LEADTOOLS进行表单识别和处理
表单识别和处理库以及适用于所有开发和目标平台(包括Windows、Linux、macOS、C/ c++和Java)的所有LEADTOOLS识别、文档、医疗、矢量和成像技术。
只需要几行代码就可以了:
//在c#中识别和处理一个表单const string repoFolder = @"C:\Forms\MasterForm Repo";var fileToProcess = @"C:\Forms\Inbox\ScannedForm.tif";var codecs = new RasterCodecs();var repository = new DiskMasterFormsRepository(codecs, repoFolder);var ocrEngine = ocrengemanager . createengine (OcrEngineType. var ocrEngine = ocrenginmanager . createengine)铅、假);var barcodeEngine = new barcodeEngine ();ocrEngine。启动(null, null, null, @"C:\LEADTOOLS 22\Bin\Common\OcrLEADRuntime");var autoEngine = new AutoFormsEngine(repository, ocrEngine, barcodeEngine, 30,80, true) {RecognizeFirstPageOnly = true, MinimumConfidenceKnownForm = 40};var result = autoEngine。Run(fileToProcess, null);