news 2026/6/9 22:34:23

Linux CFS(完全公平调度器)原理与实现细节全解析(3)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Linux CFS(完全公平调度器)原理与实现细节全解析(3)

接前一篇文章:Linux CFS(完全公平调度器)原理与实现细节全解析(2)

二、核心概念与关键抽象

2.3 CFS运行队列(cfs_rq)与红黑树

每个CPU都维护一个就绪队列struct rq,其中CFS使用自己的子结构struct cfs_rq管理所有属于CFS调度类的可运行实体。

cfs_rq的核心成员之一是一棵按vruntime排序的红黑树

  • 所有处于TASK_RUNNING状态的sched_entity都在这棵树上;

  • 树中最左节点就是vruntime最小的任务,即下一个最该运行的任务
  • 插入/删除/查找均为 O(log N),在任务数很大时仍然可控。

红黑树的存在,使得CFS可以用非常简洁的逻辑实现:

“永远选择vruntime最小的任务运行”

典型操作如下:

  • enqueue_entity()

新任务就绪 / 唤醒 → 插入rb-tree;

  • dequeue_entity()

任务阻塞 / 退出 → 从rb-tree移除;

  • pick_next_task_fair()

取 rb-tree 最左节点 → 下一个运行任务。

同时,cfs_rq中还维护一个关键字段:

  • min_vruntime

当前运行队列中所有实体vruntime的下界近似值,主要用于新任务vruntime初始化与全局“时间对齐”。

2.4 权重、nice值与调度粒度

在Linux中:

  • nice值范围为[-20, +19],数值越小优先级越高;
  • CFS使用sched_prio_to_weight[]将nice值映射为整数权重weight

  • 权重近似呈指数级变化:每降低1个nice,权重大约乘以1.25。

例如(示意):

  • nice = 0 → weight = 1024;
  • nice = -1 → weight ≈ 1277;
  • nice = +1 → weight ≈ 820。

CFS使用如下公式更新vruntime:

[ \Delta \text{vruntime} = \Delta t_\text{exec} \times \frac{\text{NICE_0_LOAD}}{\text{weight}} ]

因此:

  • 权重越大(nice越低),同样运行1ms,其vruntime增加得更少;
  • 权重越小(nice越高),vruntime增加得更多,在红黑树中更容易被“推到右边”,降低调度频率。

此外,为避免过度频繁的上下文切换,CFS引入了几个重要参数:

  • sched_min_granularity

最小调度粒度(默认约 0.75ms),单次调度不希望明显短于该值;

  • sched_latency

目标调度延迟(默认约 6ms),即当可运行任务数较少时,每个任务在一个周期内大致能运行一次;

  • 当任务数nr_running较多时,sched_latency会按nr_running sched_min_granularity动态放大,以避免极端高频切换。

更多内容请看下回。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 1:50:37

历年中南大学计算机考研复试机试真题

2025年中南大学计算机考研复试机试真题 2025年中南大学计算机考研复试上机真题 历年中南大学计算机考研复试上机真题 历年中南大学计算机考研复试机试真题 更多学校题目开源地址:https://gitcode.com/verticallimit1/noobdream N 诺 DreamJudge 题库&#xff1…

作者头像 李华
网站建设 2026/6/10 2:20:43

服务器被DDOS跟CC攻击了怎么处理,如何抵御攻击?

服务器在运行过程中,遭遇 DDoS 或 CC 攻击几乎是很多站长、运维人员绕不开的问题。无论是企业官网、电商平台,还是游戏、接口服务,一旦被攻击,轻则访问缓慢、用户流失,重则业务中断、数据风险增加。理解攻击本质、掌握…

作者头像 李华
网站建设 2026/6/10 11:30:09

低成本PPG心率检测传感器原理图设计,已量产(e-Health传感器)

目录 1、PPG 传感器前端:SON1303 的驱动与信号拾取 2、信号预处理:交流耦合与前置放大 3、模拟信号缓冲与输出 4、数字心率信号:比较整形与指示 5、可调设计:路径选择与增益适配 在便携式健康监测设备中,低成本、小型化的 PPG(光电容积脉搏波描记法)心率检测方案一…

作者头像 李华
网站建设 2026/6/10 11:59:49

28、脚本编程进阶:从变量到流程控制

脚本编程进阶:从变量到流程控制 1. 变量与输出方法 在脚本编程中,变量和输出是基础且关键的部分。为了避免shell对变量名的错误解析,我们可以使用花括号。例如,在变量后添加花括号,能防止尾随的字符被误当作变量名的一部分。 同时,将变量和命令替换用双引号括起来是一…

作者头像 李华
网站建设 2026/6/10 11:59:18

启用 FlashAttention 的令牌压缩 “表象移动 “的工作原理和效果

摘要 本文提出了一种新方法来应对变压器模型计算成本增加的挑战。 近年来,变换器已被广泛应用于自然语言处理和图像/视频理解领域,但随着规模的扩大,处理效率已成为一个严重问题,因为自我注意机制的计算复杂度与输入词块数量的平方…

作者头像 李华