# 拍图识字 用于自然拍照场景,识别图片中的文字内容,并返回识别的结构化结果。 ## 请求格式说明 ** 调试工具:** 在线调试

请求方式:POST (HTTPS)

请求地址:

https://open.welink.huaweicloud.com/api/aiservice/v1/ocr/web-image

认证方式: access_token,请参考获取access_token

请求头部:

Content-Type: application/json    
x-wlk-Authorization: access_token

请求参数

{ 
    "image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."
}

请求参数说明

参数 必选 参数类型 说明
image String 图像数据,base64编码,要求base64编码后大小不超过10MB。图片最小边不小于15像素,最长边不超过8192像素,支持JPEG/JPG/PNG/BMP/TIFF/GIF/WEBP格式。
detectDirection Boolean 若不传该字段,默认不检测图像倾斜角度文字方向,为True时,支持任意角度的旋转倾斜。
extractType Array[String] 结构化数据提取参数列表,目前只支持联系人信息、图像宽高,其入参值分别为"contact_info","image_size",若该字段为空列表或缺失该字段,默认不提取。

请求示例

 curl -X POST \
  'https://open.welink.huaweicloud.com/api/aiservice/v1/ocr/web-image' \
  -H 'Accept-Charset: UTF-8' \
  -H 'Content-Type: application/json' \
  -H 'x-wlk-Authorization: access_token' \
  -d '{"image":"/9j/4AAQSkZJRgABAgEASABIAAD/4RFZRXhpZgAATU0AKgAAAA..."}'

响应格式说明

返回结果 正常返回结果

{
    "code": "0",
    "data": {
            "words_block_count": 2, 
            "words_block_list": [ 
          { 
              "words": "文字块1", 
              "confidence": 0.9950,
              "location": [ 
                  [13, 476], 
                  [91, 332], 
                  [125, 351], 
                  [48, 494] 
              ] 
          }, 
          { 
              "words": "文字块2", 
              "confidence": 0.9910,
              "location": [ 
                  [13, 476], 
                  [91, 332], 
                  [125, 351], 
                  [48, 494] 
              ] 
          } 
      ],
      "extracted_data": {}
    },
    "error": "",
    "message": "ok"
}

异常返回结果

  • Token验证失败响应示例
    {
      "code": "58401",
      "data": null,
      "error": "Failed to verify the token.",
      "message": "Login authentication failed."
    }
    

返回参数说明
网络图片识别响应参数说明请参见表。

  • 响应参数说明
参数 必选 参数类型 说明
code String 错误码
message String 调用成功时为"ok"。调用失败时的错误信息。
data Object 调用成功时表示调用结果,详见data数据结构。调用失败时为null。
error String 错误信息。

data 数据结构

参数 必选 参数类型 说明
words_block_count Integer 代表检测识别出来的文字块数目。
words_block_list Array of objects 识别文字块列表,输出顺序从左到右,从上到下。
words String 文字块识别结果。
location Array of objects 文字块的区域位置信息,列表形式,分别表示文字块4个顶点的x, y坐标; 图像坐标原点为图像左上角,x轴沿水平方向,y轴沿竖直方向。
extracted_data Object 提取出的结构化JSON结果,该字典内的key值与入参列表extract_type的值一致,目前仅支持联系人信息提取,亦即key值为"contact_info"的字段。若入参extract_type为空列表或该字段缺失时,不进行提取,此字段为空。
contact_info Object 该字段表示提取的联系人信息,包括:姓名、联系电话、省市区以及详细地址。若入参extract_type列表中无该字段,则此字段不存在。
image_size Object 该字段表示返回图片宽高信息。如入参extract_type列表中无该字段,则此字段不存在。
height Integer 传入image_size时的返回,为图像高度。
width Integer 传入image_size时的返回,为图像宽度。
name String 传入contact_info时的返回,为姓名。
phone String 传入contact_info时的返回,联系电话。
province String 传入contact_info时的返回,省。
city String 传入contact_info时的返回,市。
district String 传入contact_info时的返回,县区。
detail_address String 传入contact_info时的返回,详细地址(不含省市区)。
confidence Float 相关字段的置信度信息,置信度越大,表示本次识别的对应字段的可靠性越高,在统计意义上,置信度越大,准确率越高。置信度由算法给出,不直接等价于对应字段的准确率。

错误码说明

错误码 说明
0 成功。
58401 无权限。
58402 非法输入参数。
58500 服务异常。
58001 OCR服务异常。

结果。 ""

    无结果。 ""