在 GOMAXPROCS=64 的 ARM 服务器上，sysmon 线程如何探测调度饥饿 - 问题详情 - 创脉思

解读

国内云原生面试常把“调度饥饿”作为区分 P7 与 P8 的试金石。
题面给出 GOMAXPROCS=64 这一典型 ARM 高核数场景，意在考察候选人是否理解：

sysmon 在 多 P 环境 下的采样策略；
饥饿探测的 量化阈值 与 平台差异（ARM 无 TSC，时钟源精度有限）；
探测到饥饿后，sysmon 如何 精准唤醒 P 以避免“伪饥饿”抖动。

回答必须围绕 “采样→计算→决策→干预” 四步闭环，并指出 ARM 下的时间精度对阈值的影响。

知识点

sysmon 的独立线程属性：不受 P 绑定，每 20 µs 一次循环（sysmon→usleep(20)）。
调度饥饿定义：存在 可运行 G（runq.length>0） 且 连续 10 ms 无 P 运行该 G。
时间源选择：
- x86 用 TSC 差分，精度 <100 ns；
- ARM 服务器用 CNTVCT_EL0 或 arch_timer，精度约 1 µs，sysmon 采样时需 放大阈值 2 µs 以抵消误差。
饥饿探测算法：
遍历全局 allp[]，记录 (p.runqhead, p.runqtail, p.status) 快照；
若 runq.length>0 且 now - p.schedtick>10 ms 且 p.status!=_Prunning，则记为 候选饥饿 P；
连续 两轮采样（40 µs） 均满足条件，触发 wakep()，将 P 投入 全局队列 并绑定空闲 M。
ARM64 下的优化：
内核时钟频率可能动态缩放，sysmon 在启动时调用 runtime·osinit() 校准 clockrate，把 10 ms 转换成 cycle 数 而非绝对时间，避免频率切换导致误判。

答案

sysmon 每 20 µs 遍历 64 个 P，对每个 P 记录 runq 长度 与 上次调度时间戳。
当发现某 P 的 本地队列非空 且 连续 10 ms 未被运行（ARM 下用 CNTVCT_EL0 计数，阈值放大到 10 ms+2 µs 补偿精度误差），即判定为 调度饥饿。
为防止误判，sysmon 采用 双采样确认：连续两次循环均命中才调用 wakep()，把该 P 放入 全局可运行链表，并尝试 窃取 half-runq 到当前空闲 P，从而在高核数 ARM 场景下 亚毫秒级 解除饥饿。

拓展思考

若 GOMAXPROCS 动态缩容到 8，sysmon 仍按 20 µs 周期采样，CPU 占用率 是否成为瓶颈？
答：不会。Go1.22 引入 自适应采样，当 allp 长度 <16 时，sysmon 把周期放宽到 100 µs，保证 <0.3% 的单核开销。
在 cgroup cpu.max=4 的容器里，64 P 的饥饿探测是否失效？
答：sysmon 只认 逻辑 P 数量，不认 cgroup 配额；若实际只有 4 核时间片，饥饿会 高频触发，导致 ** thundering herd**。此时应 调小 GOMAXPROCS 至配额核数，或启用 sched.cpu=quota 的实验特性，让运行时自动感知限额。