在本主题▼

ExtractText

从文件中提取文本，可以通过对以下URL的POST请求调用:

[文章]https://azure.leadtools.com/api/Recognition/ExtractText

通用服务请求URL参数

除非另有说明，否则以下参数是必需的，并被所有转换和识别API调用使用:

参数	描述	接受的价值观
`fileUrl`(可选)	要处理的文件的URL。有关更多信息，请参阅云服务概述部分。	包含要上传文件的有效URL的字符串或URI。
`珍宝`	要处理的文件中的第一页。	一个介于1和文件中总页数之间的整数值。
`lastPage`	要处理的文件中的最后一页。	传递-1或0值将向服务指示将处理First Page参数和文件中最后一页之间的所有页面。否则，必须传递一个介于1和文件中总页数之间的整数值，且该值必须大于或等于FirstPage参数中指定的值。
`guid`(可选)	上传文件的唯一标识符。该值将在使用UploadFile服务调用上传文件时返回。	一个有效的GUID
`filePassword`(可选)	解锁密码保护文件的密码。	包含安全PDF密码的字符串。
`callbackUrl`(可选)	传递一个callbackURL到服务将允许我们在您的文件完成处理时通知您。如果callbackUrl无效或恶意，它将被忽略。LEADTOOLS云服务将在发送到callbackUrl的消息正文中发送请求的ID。	包含有效的消息URL的字符串或URI。
`ocrLanguage`(可选)	OCR语言用于对光栅文件进行OCRing。如果没有指定语言，则默认为en (English)。	0 - en 1 - bg 2小时 3 - cs 4 - da 5 - nl 6 - fr 7 - de 8 - el 9 - hu 10 .它 11 - pl 12 - pt 13 - sr 14 - es 15 - sv 16 - tr 17 -英国

请求特定参数

下面列出了其他可用的参数。

参数	描述	接受的价值观
`characterinfo`(可选)	值，该值指示您是否希望接收关于在每页中找到的字符及其位置的附加数据。	一个布尔值

状态码

当调用该方法时，将返回以下状态代码:

状态	描述
200	请求已成功接收。
400	由于下列原因之一，该请求无效: 所需的请求参数不包括在内。未提供GUID值。文件信息格式不正确。试图将尚未验证的文件上的请求排队。
401	AppID/Password组合无效或与提供的GUID不对应。
402	应用程序中没有足够的页面来处理请求。
500	处理您的请求时发生内部错误。

如果执行单服务调用，将返回一个惟一标识符，可用于查询提取的进度。

在线演示

这个方法在我们的生活中是免费的在线演示．您不需要帐户，可以测试自己的文件以查看结果。

例子

JavaScript (node . js)

Python

PHP

Perl

//简单的脚本，用于生成和处理对LEADTOOLS CloudServices的ExtractText请求的结果。常量请求=要求(“请求”）;varservicesUrl =“https://azure.leadtools.com/api/”；//文件中要标记进行处理的第一页varfirstPage = 1;//发送-1值将向服务指示应该处理文件中的其余页面。varlastPage = -1;//我们将通过URL上传文件。也可以通过向请求添加PostFile来传递文件。每个请求只接受一个文件。//服务将使用以下优先级来确定请求试图做什么GUID > URL >请求正文内容varfileURL =“https://demo.leadtools.com/images/pdf/leadtools.pdf”；varrecognitionUrl = servicesUrl +的识别/ ExtractText吗?珍宝= '+ firstPage +“&lastPage = '+ lastPage +“&fileurl = '+ fileURL;request.post (getRequestOptions (recognitionUrl) recognitionCallback);函数recognitionCallback(错误，响应，正文){如果(！错误&&响应。statusCode == 200){varGuid =身体;console.log ("服务返回的唯一ID: "+ guid);｝｝函数getRequestOptions (url) {生成并返回HTTP请求选项的函数。varrequestOptions = {url: url、标题:{内容长度的: 0}，身份验证:{用户:“输入应用程序ID”，密码:“输入应用程序密码”｝};返回requestOptions;｝

使用系统;使用System.Collections.Generic;使用来;使用包含;使用System.Threading.Tasks;使用System.Threading;使用System.Net;使用System.Net.Http;使用System.Net.Http.Headers;使用Newtonsoft.Json.Linq;名称空间Azure_Code_Snippets。文档ationSnippets｛类CloudServices_ExtractText_Demo｛私人字符串hostedServicesUrl =“https://azure.leadtools.com/api/”；公共异步无效ExtractTextAdditional ()｛//文件中要标记进行处理的第一页intfirstPage = 1;//发送一个-1的值将指示服务应该处理文件中的所有页面。intlastPage = -1;字符串fileURL =“https://demo.leadtools.com/images/pdf/leadtools.pdf”；字符串recognitionUrl =字符串.Format (“认可/ ExtractTextAdditional吗?珍宝={0}&lastPage={1}&fileurl={2}"， firstPage, lastPage, fileURL);var客户端= InitClient();var结果=等待客户端。PostAsync (recognitionUrl零）;如果(结果。状态Code == HttpStatusCode.OK)｛//服务返回的唯一ID字符串id = await result.Content.ReadAsStringAsync();控制台。WriteLine (服务返回的唯一ID:+ id);｝其他的控制台。WriteLine ("请求失败，响应如下"+ result.StatusCode);｝私人HttpClient InitClient ()｛字符串AppId =“输入应用程序ID”；字符串密码=“输入应用程序密码”；HttpClient客户端=新HttpClient ();客户端。BaseAddress =新Uri (hostedServicesUrl);client.DefaultRequestHeaders.Accept.Clear ();client.DefaultRequestHeaders.Accept.Add (新System.Net.Http.Headers.MediaTypeWithQualityHeaderValue (“application / json”));字符串authData =字符串.Format (“{0}:{1}”， AppId，密码);字符串authHeaderValue = Convert.ToBase64String(Encoding.UTF8.GetBytes(authData));client.DefaultRequestHeaders.Authorization =新AuthenticationHeaderValue (“基本”, authHeaderValue);返回客户端;｝｝｝

#向LEADTOOLS CloudServices发送ExtractText请求并解析结果JSON的简单脚本。导入请求，sys, timeservicesUrl =“https://azure.leadtools.com/api/”baseRecognitionUrl =“{}识别/ ExtractText吗?珍宝={}&lastPage={}&fileurl={}'#要标记为处理的文件中的第一页firstPage = 1#发送-1值将向服务指示应该处理文件中的其余页面。lastPage = -1我们将通过URL上传文件。也可以通过向请求添加PostFile来传递文件。每个请求只接受一个文件。#服务将使用以下优先级来确定请求试图做什么GUID > URL >请求正文内容fileURL =“https://demo.leadtools.com/images/pdf/leadtools.pdf”formattedRecognitionUrl = baseRecognitionUrl。格式(servicesUrl,firstPage, lastPage, fileURL)#应用程序ID。appId =“输入应用程序ID”；#应用程序密码。密码=“输入应用程序密码”；请求=请求。post(formattedRecognitionUrl, auth=(appId，密码))如果请求。Status_code = 200:打印（"发送转换请求\n错误"）打印(request.text)sys。退出（）从请求中获取GUIDGuid = request.text打印（服务返回的唯一ID:+ guid +“\ n”）

<？php//向LEADTOOLS CloudServices发送ExtractText请求并解析结果JSON的简单脚本。$ servicesBaseUrl =“https://azure.leadtools.com/api/”；$ baseRecognitionURL =' % sRecognition / ExtractText吗?珍宝=%s&lastPage=%s&fileurl=%s'；//文件中要标记进行处理的第一页$firstPage = 1;//发送-1值将向服务指示应该处理文件中的其余页面。$lastPage = -1;//我们将通过URL上传文件。也可以通过向请求添加PostFile来传递文件。每个请求只接受一个文件。//服务将使用以下优先级来确定请求试图做什么GUID > URL >请求正文内容$ fileURL =“https://demo.leadtools.com/images/pdf/leadtools.pdf”；$formattedConversionURL = sprintf($baseRecognitionURL， $servicesBaseUrl， $firstPage， $lastPage， $fileURL);$conversionRequestOptions = GeneratePostOptions($formattedConversionURL);$request = curl_init();curl_setopt_array(请求,conversionRequestOptions美元);//设置请求URL如果(！$guid = curl_exec($request)｛回声"处理请求时出错。r \ n \”；回声guid美元;退出；｝curl_close($请求);//关闭请求回声服务返回的唯一ID: $guid \n\r；函数GeneratePostOptions (url)美元｛$ appId =“输入应用程序ID”；密码=美元“输入应用程序密码”；头=美元数组（Content-Length: 0）;$ postOptions =数组（Curlopt_post => 1，CURLOPT_URL => $url，Curlopt_fresh_connect => 1，Curlopt_returntransfer => 1，CURLOPT_USERPWD = >“appId:密码美元”，Curlopt_forbid_reuse => 1，CURLOPT_HTTPHEADER => $headers）;返回postOptions美元;｝? >

制作和处理LEADTOOLS CloudServices的ExtractText请求结果的简单脚本。使用基地“HTTP:消息”；使用LWP:: UserAgent ();需要HTTP::请求;需要HTTP::标题;my $servicesUrl =“https://azure.leadtools.com/api/”；#要标记为处理的文件中的第一页my $firstPage = 1;#发送-1值将向服务指示应该处理文件中的其余页面。my $lastPage = -1;我们将通过URL上传文件。也可以通过向请求添加PostFile来传递文件。每个请求只接受一个文件。#服务将使用以下优先级来确定请求试图做什么GUID > URL >请求正文内容my $fileURL =“https://demo.leadtools.com/images/pdf/leadtools.pdf”；我的$appId =“输入应用程序ID”；我的$密码=输入应用程序密码；my $headers = HTTP:: headers ->新（Content_Length => 0）;标题- > authorization_basic (appId美元,美元密码);#发出请求时使用的用户代理my $ua = LWP::UserAgent->新；在这个脚本中，我们将从条形码中提取信息。my $recognitionUrl = $servicesUrl。的识别/ ExtractText吗?珍宝= '．美元的珍宝。“&lastPage = '．lastPage美元。“&fileurl = '．fileURL美元;my $request = HTTP:: request ->新(POST => $recognitionUrl， $headers);我的$response = $ua->请求($request);如果(! $响应——> is_success) {打印STDERR反应- > status_line,“\ n”；退出；｝My $guid = $response->decoded_content;打印（服务返回的唯一ID:．美元的guid。“\ n”）;

另请参阅

资源

法律

下载我们的免费评估

帮助版本22.0.2022.12.14

LEADTOOLS云服务

API参考概述

安全

API参考

开始

188金宝搏beat体育官网演示和代码技巧

更改日志

服务水平协议

服务条款