本教程展示如何使用LEADTOOLS SDK从c# . net 6控制台应用程序中的非结构化文档中检索数据。使用在JSON文件中定义的规则集提取数据,并与LEADTOOLS Document Analyzer配合使用。
概述 | |
---|---|
总结 | 方法从非结构化文档中检索数据DocumentAnalyzer 在c# . net 6控制台应用程序中。 |
完成时间 | 20分钟 |
Visual Studio项目 | 下载教程项目(1kb) |
平台 | c# .NET 6控制台应用程序 |
IDE | Visual Studio 2022 |
运行时目标 | .NET 6或更高版本 |
开发许可 | 下载LEADTOOLS |
步骤熟悉创建项目的基本步骤添加引用和设置License教程,在工作之前使用文档分析器解析数据- .NET 6控制台c#教程。
中创建的项目的副本开始添加引用和设置License教程。如果项目不可用,请按照该教程中的步骤创建它。
所需要的参考资料取决于项目的目的。引用可以通过NuGet包添加。
本教程需要以下NuGet包:
Leadtools.Document.Sdk
Newtonsoft。Json
有关应用程序需要哪些DLL文件的完整列表,请参阅你的申请所包含的文件.
许可证解锁项目所需的特性。它必须在调用任何工具箱函数之前设置。有关详细信息,包括针对不同平台的教程,请参阅设置运行时License.
有两种类型的运行时许可证:
请注意
中详细介绍了添加LEADTOOLS NuGet引用和设置许可添加引用和设置License教程。
随着项目的创建、引用的添加和许可的设置,编码就可以开始了。
在解决方案资源管理器,打开Program.cs
.将下列语句添加到使用
块的顶部Program.cs
.
//在顶部使用块
使用系统;
使用System.Collections.Generic;
使用先;
使用Leadtools;
使用Leadtools.Document;
使用Leadtools.Document.Analytics;
使用Leadtools.Document.Data;
使用Leadtools.Document.Unstructured;
使用Leadtools.Ocr;
所有必要的代码都将在Main ()
方法。将以下代码添加到主要
方法初始化IOcrEngine
,加载非结构化文档,并将提取的数据显示到控制台DocumentAnalyzer
类。
静态无效主要(字符串[]参数)
{
试一试
{
字符串规则集=@ " C: \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.json图像资源”;
字符串文件=@ " C: \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.png图像资源”;
如果(! InitLEAD ())
控制台。WriteLine (“设置许可证错误”);
其他的
控制台。WriteLine ("License文件设置成功");
使用(IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(ocrengintype . lead))
{
ocrEngine。启动(零,零,零,零);
LEADDocument document = DocumentFactory。LoadFromFile(文件,新LoadDocumentOptions ());
document.Text.OcrEngine = ocrEngine;
//创建分析器
DocumentAnalyzer分析器=新DocumentAnalyzer ()
{
读者=新UnstructuredDataReader (),
QueryContext =新FileRepositoryContext(规则集)
};
documentanalyzerrunnoptions options =新documentanalyzerrunnoptions {ElementQuery =新RepositoryQuery ()};
List
results = analyzer。运行(文档,选择); foreach(ElementSetResult结果在结果)
foreach(ElementResult项在result.Items)
Console.WriteLine (item.Value);
}
}
抓(异常交货)
{
Console.WriteLine (ex.ToString ());
}
控制台。WriteLine (“按任意键退出…”);
控制台。ReadKey (真正的);
}
按下运行项目F5,或选择Debug ->开始调试.
如果正确地执行了这些步骤,将出现控制台,应用程序将显示从非结构化文档中提取的数据。出于本教程的目的,使用下面的示例文件进行测试。
< INSTALL_DIR > \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.png图像资源
示例规则集JSON:< INSTALL_DIR \ LEADTOOLS22 \ \ \ \非结构化形式\ MedicareCard.json图像资源>
方法提取和显示关于非结构化文档的信息DocumentAnalyzer
JSON规则集。