news 2026/4/18 8:36:13

小白也能跑通华为云OCR:手把手整合 Hutool 与华为云签名 SDK 并解决依赖难题

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
小白也能跑通华为云OCR:手把手整合 Hutool 与华为云签名 SDK 并解决依赖难题

小白也能跑通华为云OCR:手把手整合 Hutool 与华为云签名 SDK 并解决依赖难题


如果你喜欢我的回答或想获取更多有趣、有用的内容,
欢迎关注微信公众号:云技纵横 ,
这样就能及时看到我的更新啦~ 😊 你的支持是我前进的动力!


一、两种调用方式总览

  • 方式A 官方通用 SDK(推荐,长期可维护)
    • 使用华为云官方Java SDK(huaweicloud-sdk-ocr),通过AK/SK认证,支持设置Region/Endpoint、代理、超时、SSL 等,异常体系完善,适合生产环境。
  • 方式B 签名 SDK + Hutool(你当前写法)
    • 使用华为云网关签名 SDK 的Client.sign对请求签名,配合Hutool/HttpClient发送表单请求,灵活可控,但需自行解决签名 JAR 的依赖托管。

二、方式A 官方通用 SDK 完整示例(推荐)

  • 适用场景:通用 OCR、表格、票据、证件等;依赖少、升级方便、可维护性强。
  • Maven 依赖(示例版本,可按需升级)
<dependencies><!-- 华为云 OCR SDK --><dependency><groupId>com.huaweicloud</groupId><artifactId>huaweicloud-sdk-ocr</artifactId><version>3.1.12</version></dependency><!-- JSON 工具(可选) --><dependency><groupId>cn.hutool</groupId><artifactId>hutool-json</artifactId><version>5.8.22</version></dependency></dependencies>
  • 读取图片为 Base64 的工具方法
publicclassBase64Util{publicstaticStringimageToBase64(StringimgPath)throwsException{byte[]bytes=Files.readAllBytes(Paths.get(imgPath));returnBase64.getEncoder().encodeToString(bytes);}}
  • 调用通用 OCR 表格识别(RecognizeGeneralTable),并抽取关键字段
publicclassOcrOfficialSdkDemo{// 建议通过环境变量读取:HUAWEICLOUD_SDK_AK / HUAWEICLOUD_SDK_SKprivatestaticfinalStringAK=System.getenv("HUAWEICLOUD_SDK_AK");privatestaticfinalStringSK=System.getenv("HUAWEICLOUD_SDK_SK");// 区域:如 cn-north-4;也可改为 endpoint 方式privatestaticfinalStringREGION="cn-north-4";publicstaticvoidmain(String[]args){try{// 1) 读取图片 Base64StringimgBase64=Base64Util.imageToBase64("D:/tmp/demo.png");// 2) 认证与客户端BasicCredentialscred=newBasicCredentials().withAk(AK).withSk(SK);// 如使用永久 AK/SK,部分场景需填写 projectId(按控制台指引获取)// cred.withProjectId("your-project-id");HttpConfigconfig=HttpConfig.getDefaultHttpConfig().withTimeout(60);// 可按需调整OcrClientclient=OcrClient.newBuilder().withHttpConfig(config).withCredential(cred).withRegion(OcrRegion.valueOf(REGION)).build();// 3) 组装请求(以表格识别为例,支持图片URL或Base64)RecognizeGeneralTableRequestreq=newRecognizeGeneralTableRequest();GeneralTableRequestBodybody=newGeneralTableRequestBody()// .withUrl("https://your-obs-url/xxx.png") // 也可传 URL.withImageBase64(imgBase64);req.withBody(body);// 4) 发送请求RecognizeGeneralTableResponseresp=client.recognizeGeneralTable(req);System.out.println("OCR 调用成功:\n"+resp.toString());// 5) 业务字段抽取示例(按实际接口返回结构调整)// 通用表格接口返回结构不同,请参考控制台 API 文档解析// Map<String, Object> result = resp.getResult();// String tableStr = JSONUtil.toJsonStr(result);// System.out.println("抽取结果:\n" + tableStr);}catch(ConnectionException|RequestTimeoutExceptione){System.err.println("网络类异常:"+e.getMessage());}catch(ServiceResponseExceptione){System.err.println("服务响应异常:");System.err.println("HTTP状态码="+e.getHttpStatusCode());System.err.println("错误码="+e.getErrorCode());System.err.println("错误信息="+e.getErrorMsg());}}}
  • 说明
    • 认证支持永久 AK/SK临时 AK/SK + SecurityToken;客户端可指定RegionEndpoint;可配置代理/超时/SSL;异常分为连接类与响应类,便于定位问题。

三、方式B 签名 SDK + Hutool 完整示例(当前写法,含依赖安装脚本)

  • 适用场景:必须使用网关签名 SDK(如某些联营/专享环境)。
  • 安装签名 SDK 到本地或私有仓库(只需一次)
# 将 java-sdk-core-3.2.4.jar 放到当前目录后执行mvn install:install-file\-Dfile=java-sdk-core-3.2.4.jar\-DgroupId=com.huaweicloud.apigateway\-DartifactId=java-sdk-core\-Dversion=3.2.4\-Dpackaging=jar
  • Maven 依赖(示例)
<dependencies><!-- Hutool 工具 --><dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</artifactId><version>5.8.22</version></dependency><!-- Apache HttpClient --><dependency><groupId>org.apache.httpcomponents</groupId><artifactId>httpclient</artifactId><version>4.5.14</version></dependency><!-- 华为云网关签名 SDK(已本地安装或私有仓库托管) --><dependency><groupId>com.huaweicloud.apigateway</groupId><artifactId>java-sdk-core</artifactId><version>3.2.4</version></dependency></dependencies>
  • 工具类
publicclassHuaweiCloudOcr{publicHashMap<String,String>identifyWaybill(StringimgBase64)throwsException{Requestrequest=newRequest();request.setKey(appKey);request.setSecret(appSecret);request.setMethod("POST");request.setUrl("https://jmexpressbill.apistore.huaweicloud.com/ocr/express-bill");request.addHeader("Content-Type","application/x-www-form-urlencoded");Stringencode=URLUtil.encodeAll(imgBase64);request.setBody("base64="+encode);HttpRequestBasesignedRequest=Client.sign(request);// 发送请求try(CloseableHttpClientclient=HttpClients.createDefault();CloseableHttpResponseresp=client.execute(signedRequest)){intstatus=resp.getStatusLine().getStatusCode();if(status!=200){Stringbody=resp.getEntity()==null?"":EntityUtils.toString(resp.getEntity(),"UTF-8");log.error("OCR识别失败,HTTP状态码={},响应={}",status,body);thrownewRuntimeException("OCR识别运单失败,HTTP "+status);}HttpEntityentity=resp.getEntity();if(entity==null)thrownewRuntimeException("OCR响应体为空");StringrespStr=EntityUtils.toString(entity,"UTF-8");JSONObjectjson=JSONUtil.parseObj(respStr);intcode=json.getInt("code",-1);Stringmsg=json.getStr("msg","未知错误");}}}
  • 说明
    • 表单字段名必须为base64;对 Base64 做URL 编码更稳妥;签名前后请求方法、URL、Headers、Body 必须保持一致;建议统一用UTF-8解析响应。

四、常见问题与排查清单

  • 依赖找不到
    • 签名 SDK 未发布到公共仓库时,先本地安装(install:install-file)或上传到私有仓库;确保groupId/artifactId/version与代码一致;必要时清理~/.m2/repository后重试。
  • 403/签名失败
    • 核对appKey/appSecret;确认请求方法、URL、Headers、Body 与签名前完全一致;确认Base64 已 URL 编码;检查系统时间偏差(部分签名算法依赖时间)。
  • 返回非 200
    • 打印完整请求与响应(含 Headers/Body);核对Content-Type: application/x-www-form-urlencoded;确认字段名为base64;图片过大时按接口限制压缩或改用 URL 传图(若支持)。
  • 图片过大或格式不符
    • 优先压缩至接口支持范围;确认格式为常见类型(如 JPG/PNG);必要时先上传到OBS获取临时 URL 再识别(部分接口支持 URL 方式)。
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 8:07:37

Spring IOC 源码学习一 基本姿势

为一个过来人, 没有方式方法学习 Spring 源码枯燥无味的&#xff0c;建议你&#xff1a;熟悉常见的Spring关键接口&#xff1a;Spring 框架庞大而复杂&#xff0c;扩展点非常多&#xff0c;建议先了解学习 Spring 常见外围的扩展功能点&#xff08;比如 在Spring中对于PostCons…

作者头像 李华
网站建设 2026/4/18 8:35:40

用一个简单模型推导卡尔曼滤波理论

尔曼滤波理论由鲁道夫卡尔曼于1960年提出&#xff0c;随后在解决“阿波罗计划”中航天器的导航问题时获得成功。卡尔曼滤波理论可以高效地处理测量误差。广泛的测量需求和测量误差的客观存在使它备受关注&#xff0c;从控制科学到电子信息&#xff0c;从航空航天到人工智能&…

作者头像 李华
网站建设 2026/4/14 15:35:45

长尾关键词在SEO策略中的角色与优化实践详解

在这篇文章中&#xff0c;将全面解析长尾关键词在SEO策略中的关键作用。首先&#xff0c;长尾关键词的特性让它们更容易与特定用户的搜索意图对接&#xff0c;进而提升网站流量与转化率。同时&#xff0c;文章将提供如何选择合适长尾关键词的技巧&#xff0c;包括使用分析工具洞…

作者头像 李华
网站建设 2026/4/18 7:05:26

如何选择光储一体化方案设计软件

在全球能源转型的浪潮中&#xff0c;光储一体化已成为企业降本增效、家庭绿色生活的核心选择。然而&#xff0c;许多人忽视了一个关键事实&#xff1a;光伏项目的收益上限&#xff0c;从设计之初就已注定。一份精准高效的设计方案&#xff0c;不仅能规避后期运维的诸多隐患&…

作者头像 李华
网站建设 2026/4/18 8:34:07

【机器学习】4.XGBoost(Extreme Gradient Boosting)

XGBoost 系统学习指南&#xff1a;原理、方法、语法与案例 XGBoost&#xff08;Extreme Gradient Boosting&#xff09;是基于梯度提升树&#xff08;GBDT&#xff09;的优化升级版&#xff0c;凭借高效性、准确性和鲁棒性成为机器学习竞赛和工业界的主流算法。本文从核心原理、…

作者头像 李华
网站建设 2026/4/15 23:48:09

Qt实现Ubuntu程序自动重启

在Ubuntu系统中使用Qt和C实现根据程序名称重启应用程序的功能&#xff0c;可以通过以下步骤实现&#xff1a;核心思路查找目标进程ID&#xff1a;使用系统命令&#xff08;如pgrep&#xff09;获取指定程序名的进程ID终止旧进程&#xff1a;使用kill命令结束目标进程启动新进程…

作者头像 李华