本教程展示如何使用LEADTOOLS SDK从c# . net 6控制台应用程序中的非结构化文档中检索数据。使用在JSON文件中定义的规则集提取数据,并与LEADTOOLS Document Analyzer配合使用。
| 概述 | |
|---|---|
| 总结 | 方法从非结构化文档中检索数据DocumentAnalyzer在c# . net 6控制台应用程序中。 |
| 完成时间 | 20分钟 |
| Visual Studio项目 | 下载教程项目(1kb) |
| 平台 | c# .NET 6控制台应用程序 |
| IDE | Visual Studio 2022 |
| 运行时目标 | .NET 6或更高版本 |
| 开发许可 | 下载LEADTOOLS |
步骤熟悉创建项目的基本步骤添加引用和设置License教程,在工作之前使用文档分析器解析数据- .NET 6控制台c#教程。
中创建的项目的副本开始添加引用和设置License教程。如果项目不可用,请按照该教程中的步骤创建它。
所需要的参考资料取决于项目的目的。引用可以通过NuGet包添加。
本教程需要以下NuGet包:
Leadtools.Document.SdkNewtonsoft。Json有关应用程序需要哪些DLL文件的完整列表,请参阅你的申请所包含的文件.
许可证解锁项目所需的特性。它必须在调用任何工具箱函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时License.
有两种类型的运行时许可证:
请注意
中详细介绍了添加LEADTOOLS NuGet引用和设置许可添加引用和设置License教程。
随着项目的创建、引用的添加和许可的设置,编码就可以开始了。
在解决方案资源管理器,打开Program.cs.将下列语句添加到使用块的顶部Program.cs.
//在顶部使用块使用系统;使用System.Collections.Generic;使用先;使用Leadtools;使用Leadtools.Document;使用Leadtools.Document.Analytics;使用Leadtools.Document.Data;使用Leadtools.Document.Unstructured;使用Leadtools.Ocr;
所有必要的代码都将在Main ()方法。将以下代码添加到主要方法初始化IOcrEngine,加载非结构化文档,并将提取的数据显示到控制台DocumentAnalyzer类。
静态无效主要(字符串[]参数){试一试{字符串规则集=@ " C: \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.json图像资源”;字符串文件=@ " C: \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.png图像资源”;如果(! InitLEAD ())控制台。WriteLine (“设置许可证错误”);其他的控制台。WriteLine ("License文件设置成功");使用(IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead)){ocrEngine。启动(零,零,零,零);LEADDocument document = DocumentFactory。LoadFromFile(文件,新LoadDocumentOptions ());document.Text.OcrEngine = ocrEngine;//创建分析器DocumentAnalyzer分析器=新DocumentAnalyzer (){读者=新UnstructuredDataReader (),QueryContext =新FileRepositoryContext(规则集)};documentanalyzerrunnoptions options =新documentanalyzerrunnoptions {ElementQuery =新RepositoryQuery ()};Listresults = analyzer。运行(文档,选择); foreach(ElementSetResult结果在结果)foreach(ElementResult项在result.Items)Console.WriteLine (item.Value);}}抓(异常交货){Console.WriteLine (ex.ToString ());}控制台。WriteLine (“按任意键退出…”);控制台。ReadKey (真正的);}
按下运行项目F5,或选择Debug ->开始调试.
如果正确地执行了这些步骤,将出现控制台,应用程序将显示从非结构化文档中提取的数据。出于本教程的目的,使用下面的示例文件进行测试。
< INSTALL_DIR > \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.png图像资源示例规则集JSON:< INSTALL_DIR \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.json图像资源>
方法提取和显示关于非结构化文档的信息DocumentAnalyzerJSON规则集。