news 2026/6/10 18:28:17

【每日一读Day9】传统搜索引擎会消失吗?LLM?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【每日一读Day9】传统搜索引擎会消失吗?LLM?

✅ 一句话总判断(先给结论)

传统搜索引擎不会消失,也不会被 LLM 完全替代。
但“只会返回 10 条蓝色链接的搜索引擎”会逐渐消失。

未来的形态是:
搜索引擎作为底座 + LLM 作为交互与总结层(Search × LLM 融合)

LLM 正在重塑搜索体验,但搜索是不可替代的基础设施


🌍 2025 年我们到底看到了什么?
🧠 表面现象(你直观感受到的)

  • ChatGPT / Kimi / 秘塔:
    👉能直接给答案 + 给链接
  • Google / Bing:
    👉 搜索结果页出现AI Summary / AI Mode
  • 用户感觉:
    👉 “我好像不需要传统搜索了”

🔬 真实技术事实(很关键)

你看到的“LLM 搜索”,底层 90% 仍然是搜索系统在工作。

用户问题 ↓ Query 理解 / 改写 ↓ 检索系统(倒排索引 / 向量索引 / 混合检索) ↓ Top-K 文档 / 链接 ↓ LLM 总结 + 生成 + 给链接

📌LLM 站在前台,但搜索引擎在后台撑着一切。


❓ 那为什么不能“只要 LLM,不要搜索”?
下面是 2025 年仍然无法绕开的现实约束👇
🧩 一、能力本质不同(这是根因)

🤖 LLM 是什么?🔎 搜索引擎是什么?
-语言概率模型
- 擅长:总结、生成、对话
- 不擅长:
- 精准定位
- 全量覆盖
- 实时更新
-信息定位系统
- 擅长:
- 找“具体的东西”
- 返回“完整结果集”
- 可排序、可过滤、可回溯
- LLM:
- 给你 1–2 个链接
- 有时会失效 / 编造 / 不完整
- 搜索引擎:
- 返回一整页资源
- 你可以自己判断真假、新旧、可用性
👉搜索的核心价值是“给你选择权”

🧱 二、工程与商业上,搜索依然不可替代
⚙️ 工程层面

维度LLM搜索引擎
实时性❌ 弱✅ 强
覆盖率❌ Top-K✅ 全量
稳定性❌ 波动✅ 可控
可解释❌ 容易幻觉✅ 可溯源
成本❌ 高✅ 低
📌搜索一次几毫秒,LLM 推理一次几百毫秒甚至秒级

💰 商业层面(决定生死)

  • 搜索 ≠ 技术 demo
  • 搜索 =广告 流量分发 内容生态 合规监管

⚠️ 如果 LLM 直接“吞掉内容、不导流”,会发生什么?

  • 内容方反对
  • 版权与监管介入
  • 商业闭环破裂
    👉这也是 Google / Bing 强调“AI + Links”的原因

🚀 未来 3–5 年,搜索会变成什么样?

🚀 趋势一:AI 搜索成为默认入口👨‍🔬 算法在干什么?
- Query 理解
- 意图分类
- Embedding 模型
- Rerank 模型
👉只回答一个问题:怎么“算得更准”
👨‍💻 后端/系统工程师在干什么?(重点)
- Query 流水线设计(多阶段)
- 搜索链路编排(召回 → 排序 → rerank → 生成)
- 缓存策略(query cache / embedding cache)
- 延迟控制(P99 / tail latency)
- 高并发 & 降级策略
📌你们解决的是:
> “1000 万用户同时问,系统还能不能活?”
🚀 趋势二:搜索 = Agent 调度中枢👨‍🔬 算法:
- Agent 的“策略”
- Tool 使用逻辑
- 可能写 prompt / planner
👨‍💻 后端才是真正的中枢
- Agent Runtime(状态机 / DAG)
- 多 Tool 并发调度
- 超时控制、失败重试
- 多路结果合并(merge / dedup)
- 引用溯源(source id / trace)
📌本质是:
> 一个“AI 时代的分布式任务调度系统”
🚀 趋势三:多模态搜索爆发👨‍🔬 算法:
- 图像 / 视频 / 音频 embedding
- 跨模态对齐(CLIP 等)
👨‍💻 后端在干什么?
- 多模态索引系统设计
- 索引分区 & 存储布局
- 跨模态统一召回接口
- 多模态排序融合
- 大文件(视频)流式处理
📌 算法给你一个 embedding,
📌你要把它变成“毫秒级可查的索引系统”。

✅ 我们的正确目标是:

成为「智能搜索 / RAG / Agent 背后的系统工程师」

🧠 技术成长路线(极其重要)

🧱 ① 搜索基本盘- 倒排索引、 索引构建 & 合并、召回 / 排序、Cache / 性能 / 稳定性
🤖 ② 搜索 × LLM(拉开差距)后端主导,算法协作
- 向量检索(ANN)
- Hybrid Search(倒排 + 向量)
- RAG 架构
- Prompt 构建 & 文档拼接(工程实现)
📌 Prompt 是“算法想法”,
📌Prompt 拼接、上下文裁剪、限长、缓存,全是后端。
🧠 ③ 再往上走(稀缺)- 多 Agent 检索编排
- 多模态检索
- 搜索评测体系(Recall / NDCG / 人评)
- 搜索 × 业务(广告 / 内容 / 电商)
📌算法只负责“打分函数”, 系统工程师负责“平台与机制”。

算法决定“能不能更准”,
后端决定“能不能上线、能不能赚钱、能不能长期跑”。

✅ 正确路线(非常清晰)
👉 定位自己为:

「智能搜索 / RAG / Agent 背后的系统工程师」
你要擅长的是:

  • 搜索系统架构
  • 高并发、低延迟
  • 检索 pipeline
  • Agent 调度
  • 稳定性与成本
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 15:02:16

LangChain从入门到进阶(7):学会让AI调用MCP「喂饭教程」

LangChain从入门到进阶(7):学会让AI调用MCP「喂饭教程」 前言 一、MCP是什么? 1.1 传统工具调用的痛点 1.2 MCP的解决方案 二、环境准备 2.1 安装Node.js和npm 2.2 安装Python依赖 2.3 配置环境变量 三、快速开始:第一个MCP应用 3.1 最简单的例子:Web自动化 3.2 使用文件…

作者头像 李华
网站建设 2026/6/9 18:47:06

测试 - 概览

官方页面 一、概念 二、分类 AndroidStudio 中的项目结构有三个目录:main(我们的业务代码)、test、androidTest。测试中能访问app中的代码,app中不能访问测试中的代码。 测试类型 Local Test 本地测试 / 单元测试 Instrumented…

作者头像 李华
网站建设 2026/6/10 7:24:30

python_图片、字幕文本、音频一键组合

python_图片、字幕文本、音频一键组合 import os import re import random import pyJianYingDraft as draft from pyJianYingDraft import TrackType, TextStyle, ClipSettings, TextBackground, KeyframeProperty from PIL import Image # 用于获取图片尺寸def split_subtit…

作者头像 李华
网站建设 2026/6/10 11:18:47

智乃的数字【牛客tracker 每日一题】

智乃的数字 时间限制:1秒 空间限制:256M 网页链接 牛客tracker 牛客tracker & 每日一题,完成每日打卡,即可获得牛币。获得相应数量的牛币,能在【牛币兑换中心】,换取相应奖品!助力每日有…

作者头像 李华
网站建设 2026/6/10 12:08:02

elastic/kibana 升级问题

问题描述 当使用 elastic/kibana 的 helm chart 部署 kibana 后,执行 helm upgrade -f values.yaml elastic/kibana 的时候,发现 kibana 启动失败。 执行 kubectl logs -f pre-install-kibana-kibana-jt8nv 查看日志 Creating a new Elasticsearch token for Kibana Cleani…

作者头像 李华
网站建设 2026/6/10 12:07:03

NNG协议

概述 NNG 是 nanomsg 的继任版本,而 nanomsg 则是流行的 ZMQ (一个简单好用的传输层,像框架一样的一个 socket library)的 C 重写版。 NNG 将通信使用的协议和传输分离,同一个协议可以工作在不同的传输层上&#xff…

作者头像 李华