news 2026/4/17 17:42:13

Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Azure AI Search 性能优化实战:从 40 秒到 8 秒的优化之旅

背景

我们的知识库问答系统使用 Azure Container Apps + Azure AI Search + Azure OpenAI 构建,架构如下:

用户请求 → Container App → AI Search (向量搜索) → OpenAI (生成回答)

系统上线后,性能表现不佳:

  • P50 响应时间:18 秒
  • P99 响应时间:41 秒
  • 最慢请求:40.9 秒

用户体验极差,需要紧急优化。

问题分析过程

第一次分析:应用层串行执行(部分正确)

查看应用日志,发现单个请求内部执行流程:

00:00:00.000 - 请求开始 00:00:02.000 - get_search_results took 7.053s 00:00:07.000 - get_search_results took 10.068s (5秒后才开始) 00:00:26.000 - get_search_results took 23.689s (19秒后才开始) 00:00:32.000 - get_search_results took 27.646s (6秒后才开始) 00:00:34.000 - combine_content took 40.618s

初步结论:应用层串行执行多次 AI

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/18 10:53:12

LabVIEW打造超实用数据回放软件:功能大揭秘

labview编写的数据回放软件,支持多曲线回放,支持曲线缩放,支持曲线打标签,支持曲线勾选可见不可见,支持点击曲线加粗显示,支持点击曲线显示当前曲线Y标尺,支持曲线配置,支持红蓝标尺…

作者头像 李华
网站建设 2026/4/18 8:53:28

LSTM,PSO-LSTM,SSA-LSTM,SSA-CNN-LSTM四种算法做数多分类

LSTM,PSO-LSTM,SSA-LSTM,SSA-CNN-LSTM四种算法做数多分类,对比了PSO粒子群优化算法和SSA麻雀搜索算法在做优化时的优劣。搞时间序列分类的老铁们肯定都懂,传统LSTM就像火锅底料里的牛油——基础但不够惊艳。今天咱们整…

作者头像 李华
网站建设 2026/4/18 5:42:25

痞子衡嵌入式半月刊: 第 119 期

断更半年,虽然早已达成当初立下的做满 100 期目标,但是回想起这个项目挺多人关注的,还是继续为大家带来更新吧。这一年原创技术文章产量也减了不少,原因是痞子衡所在公司正全力推进各种 AI 工具的使用,确实有了这些 AI…

作者头像 李华
网站建设 2026/4/18 5:41:51

[后端进阶] 详解分布式锁的三种实现方式:MySQL vs Redis vs ZooKeeper

在微服务架构或分布式系统中,Java 内置的锁(如 synchronized 或 ReentrantLock)只能限制当前 JVM 内部的线程互斥。当我们需要跨多个服务节点、跨进程地去抢占同一个资源(如“扣减库存”、“抢单”)时,就需…

作者头像 李华
网站建设 2026/4/18 5:32:59

探索多时间尺度滚动优化的多能源微网双层调度模型

多时间尺度滚动优化的多能源微网双层调度模型 参考文档:《Collaborative Autonomous Optimization of Interconnected Multi-Energy Systems with Two-Stage Transactive Control Framework》 代码主要做的是一个多能源微网的优化调度问题,首先对于下层多…

作者头像 李华