大模型常见的专用名词-程序员充电站

• RPM（Requests Per Minute）：每分钟最多允许发起多少次请求（调用次数）。超过就会报限流。  • TPM（Tokens Per Minute）：每分钟最多允许处理多少 token。token 可以理解为“文本计费单位/处理单位”（中英文拆分规则不同）。  • 重要：有的厂商 TPM只算输入 tokens，有的会把 输入+输出 都算进去；要以你用的厂商文档为准。  • RPD（Requests Per Day）：每天（或滚动 24h）最多允许多少次请求。

Token & 上下文相关
• Token：模型处理文本的基本单位；不是“字数”，中文/英文的 token 数差异很大。
• Context window / Context length（上下文窗口）：一次请求里模型能“看到”的最大 token 数（输入+输出通常都占用窗口）。
• Input tokens / Output tokens：输入消耗的 token、输出生成消耗的 token。
• Max output tokens / max_tokens：这次最多允许模型生成多少 token（防止无限输出）。
• Truncation（截断）：输入太长时被系统或你自己截断，导致模型“看不到后半段”。
限流 / 吞吐相关
• RPS / QPS（Requests/Queries Per Second）：每秒请求数（有时平台会用这个口径，而不是 RPM）。
• Burst（突发）：短时间允许你“瞬时冲高”，但会用更长窗口做平滑统计（常见于滚动窗口策略）。
• Rolling window（滚动窗口）：不是按整点清零，而是按“最近 60 秒 / 最近 24 小时”累计来算；所以你会看到“请在 X 分钟后重试”这种提示。
• Concurrency（并发）：同时在跑的请求数量上限（有的平台单独限制并发）。
• Throughput（吞吐）：单位时间输出多少 token（tokens/s），和模型大小、推理硬件、解码策略有关。
• Latency（延迟）：从发请求到拿到响应的时间；常拆成 TTFT + 生成阶段。
流式与时延拆分
• Streaming（流式输出）：模型边生成边返回（更“快看到第一段”）。
• TTFT（Time To First Token）：首 token 返回时间；对体验影响非常大。
• Tokens/s（生成速度）：流式时更直观。
计费与配额混合口径（不同厂商差异更大）
• TPD（Tokens Per Day）：每天 token 总量限制（有些平台有）。
• Spend limit（消费上限）：按金额限制（例如 Anthropic/Claude 文档里会区分消费上限和速率限制）。
• Cached tokens（缓存 token）：有的平台对“命中缓存”的 token 不计入限额或计费（具体看平台规则）。
• 音频类配额：例如按 Audio seconds per hour/day 计（做语音模型常见）。

每日Java面试场景题知识点之-ELK日志分析

场景题：微服务架构下日志分散导致故障排查困难问题描述在一家大型电商平台的微服务架构中，系统包含订单服务、用户服务、支付服务、库存服务等20多个微服务实例，每个服务部署在多台服务器上。某天凌晨，用户支付功能出现异常&…

李华

AI Agent短期记忆完全指南：4种处理长对话问题的方法+代码详解

文章详细介绍了AI Agent的短期记忆机制，分析了长对话引发的上下文丢失、响应变慢等问题，提供了4种解决方案：修剪消息、删除消息、总结消息和自定义策略。通过代码示例展示了如何实现Agent短期记忆，包括基础用法、自定义状态、消息…

李华

前后端分离墙绘产品展示交易平台系统｜SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程

💡实话实说：用最专业的技术、最实惠的价格、最真诚的态度服务大家。无论最终合作与否，咱们都是朋友，能帮的地方我绝不含糊。买卖不成仁义在，这就是我的做人原则。摘要随着数字化时代的快速发展，艺术与科技…

李华

从封闭到通用：RLVR到RLPR的LLM推理强化技术全解析

本文深入解析了强化学习在LLM推理进化中的应用，从依赖外部验证器的RLVR范式，演进到利用模型内在概率的RLPR新方法。重点介绍了1-shot RLVR的高数据效率和RLPR在通用领域的突破，结合verl框架详解工程实现。揭示了GRPO算法的核心作用和熵正则项…

李华

三阶幻方了解-七年级上册

目录一、三阶幻方的历史1. 起源：洛书（中国上古时期）2. 中国古代的发展3. 向世界的传播4. 现代价值二、现代数学中三阶幻方有哪些应用？1. 组合数学与离散数学2. 密码学与信息编码3. 实验设计与统计学4. 教育与思维训练5. 人工智…

李华

每日Java面试场景题知识点之-ELK日志分析

AI Agent短期记忆完全指南：4种处理长对话问题的方法+代码详解

前后端分离墙绘产品展示交易平台系统｜SpringBoot+Vue+MyBatis+MySQL完整源码+部署教程

从封闭到通用：RLVR到RLPR的LLM推理强化技术全解析

1. 数据存储结构

三阶幻方了解-七年级上册