揭露 bbr 的真相

信 bbr 的伙计们，我又要泼冷水了，哈哈。

从先 bbr 的海报开始，相信大家也是被它唬住的：
在这里插入图片描述

注意横坐标标度是对数，这就凸显了优势。

把它展开到自然数坐标，再把其它对照画在一个坐标系里，在此之前，须知的前置知识是 aimd 算法的吞吐与丢包率的关系(正好是上图的红线)：
$T=\alpha\dfrac{1}{RTT}\sqrt{\dfrac{1}{p}}$
重画上图如下图所示：
在这里插入图片描述

可见，bbr 只是 pixie 的变体，而 cycle_len = 2 也只是柔和版的 pixie：如果将 cycle_len 和 filter_win 缩小到 2，bbr 就是一个每次以 5/4 增益发包的 pixie 算法，如果 cycle_len 恢复为 8，它就是每 8 周期以 5/4 增益发包，期间保持 maxbw 的 pixie 算法，cycle_len 越大，对 rtt 变化越迟钝。

丝毫看不出 bbr 有 “拥塞控制” 含义。过了这么多年，那张抗 20% 丢包的海报不值得推荐。无论抗随机丢包，还是抗拥塞丢包，都是保带宽，只会加剧拥塞。详情参见：bbr 真的抗丢包吗。

拥塞多由突发导致，多数转瞬即逝，至少不恒久持续，拥塞发生时的高响应度很重要，但 bbr 对时延不敏感，做不到高响应度。

分析 pixie(记住 bbr 只是柔和版 pixie) 算法，pacing_rate = deliver_rate / (1 - p) 旨在用超量发送弥补丢包损耗，只为保带宽，但多发出的包依丢包率 p 是要丢掉的，此发送能耗为保带宽而浪费了，在丢包点上游，多余流量反而加剧拥塞，此举从头到尾接近无用功甚至净损耗。

现在来看 aimd(以 cubic 为例)，给定丢包率 p，吞吐 T 一一对应，T 和 p 相互依赖，这才能构成稳定的拥塞控制基础，不像 bbr 和 pixie，T 由发送行为决定，发得越多，吞吐越大，很容易跑飞。

注意到 cubic 的 T-p 曲线下凸，随 p 增加，T 降低变慢，注意到丢包率 p 由 buffer 大小决定，buffer 越大，p 越小，这又引出 cubic 和 bbr 对 buffer 依赖的不同风格。

从 n 条流完全同步和 n 条流完全异步作为两个极端分析。

对于 cubic/aimd，给定 p，n 条流总吞吐 T(n) 在完全异步(单流丢包率 p)时的 $T(n)=n*p^{-0.5}$ 和完全同步(单流丢包率 n*p)时的 $T(n)=n*(np)^{-0.5}=\sqrt{n}*p^{-0.5}$ 之间，上凸意味着收敛，随 bw，n 增加，所需 buffer 虽可能(仅n增加，buffer 甚至可以减少)也增加，但增速相比 bw 和 n 而言更慢。详见交换机平方反比律，主要是引用的这篇论文：Sizing Router Buffers。

再看 bbr/pixie，给定 p，n 条流总吞吐 T(n) 在完全异步时的 $T(n)=\dfrac{1}{1-p}$ 和完全同步时的 $T(n)=\dfrac{1}{1-np}$ 之间，下凸意味着发散，随着 bw，n 增加，所需 buffer 越大，bbr 限制 cwnd 作为 secondary controller 基于此。

但随网络规模扩大，n 必然增加。

把上面的画成图看一下(原始推导采用高斯分布定量计算，不太直观，我这里采用凸凹性定性分析)：
在这里插入图片描述

再重复，bbr 就是一个温和版的 pixie。

改进？还是要回到 aimd，正如 bbr2，bbr3 所做的。增加灵敏度也是必须的，哪个拥塞能持续配置参数那么久还不介入，所以还是我那个自适应 maxfilter win 沾边儿：提高 bbr 灵敏性，也不能光感知下降而不弥补上升，参见这篇：bbr2 cruise 阶段的 inflight 补偿。

说白了，bbr 就像是猜硬币正反时为了更精确而引入了地转偏向力，最后其实还不如猜 50%，于是 bbr 最终也还是回归了 aimd。

如果你想让吞吐表现得良好，又不想用 pixie，那么请用 bbr1，而不是 bbr2，bbr3，因为后面这两个是做拥塞控制的，bbr1 是做传输加速的。

最后说说如何测试。

如果你没有真实环境而非要用 Linux tc 工具模拟，千万不要再用 netem loss random 1%，netem loss 1%，这种随机丢包只能应付一下经理，一定要用 4-state markov，它的配置如下：

tc qdisc add dev eth0 root netem loss state $p13 $p31 $p32 $p23 $p14

其中状态 1，2，3，4 分别为：
在这里插入图片描述

这就能更逼真地模拟实际中的突发拥塞丢包和随机噪声丢包交错对 cc 的影响了，而 cc 的表现更加不同。

此外，用 iperf3 而不是 iperf，观察 Retr 就能估算重传率和丢包率了。

皮鞋没有蹬上，露着白袜子。

浙江温州皮鞋湿，下雨进水不会胖。

揭露 bbr 的真相

相关文章

Linux_系统信息_uname查看内核版本、内核建立时间、处理器类型、顺便得到操作系统位数等

提高Producer的发送速度

代码随想录算法训练营第五十七天丨动态规划part17

Spring Cloud Hystrix：服务容错保护

＜Linux＞（极简关键、省时省力）《Linux操作系统原理分析之Linux 进程管理 2》（6）

Windows电脑画面如何投屏到电视？怎样限定投屏内容？

不允许你还不了解指针的那些事（二）（从入门到精通看这一篇就够了）（数组传参的本质+冒泡排序+数组指针+指针数组）

“具有分布式能源资源的多个智能家庭的能源管理的联邦强化学习”文章学习三——基于联邦深度学习的多智能家居能源管理