提升全国蜂窝网络可靠性的研究与发现
1. 监测基础设施概述
监测基础设施仅在检测到故障的时间段内运行,而非整个测量过程。在日常无蜂窝故障使用时,客户端的监测基础设施处于休眠状态,不会产生额外的 CPU 开销。
对于极少数(少于 1%)用户设备,一个月内单个用户可能经历多达 40000 次以上的故障。不过,由此产生的 CPU、内存和存储开销仍可接受:CPU 利用率低于 8%,内存使用少于 2MB,存储空间占用少于 20MB;每月网络使用量可达 20MB,且仅在有 WiFi 连接时将记录的数据上传到后端服务器。
对于参与研究的 7000 万用户,三个参与研究的 ISP 整个蜂窝网络每秒的总网络开销低于 500KB,对研究的蜂窝网络影响可忽略不计。
2. 大规模部署
2019 年 12 月,邀请小米用户通过在手机上安装 Android - MOD 参与蜂窝网络可靠性测量研究。该安装是轻量级更新,不会影响已安装的应用、现有数据和操作系统版本。最终,70965549 名用户参与并在 2020 年 1 月至 8 月期间为我们收集数据。所有数据被压缩并上传到后端服务器进行集中分析。
研究中的所有分析任务均符合小米与其用户达成的协议。参与研究的用户是自愿知情同意参与的,分析在完善的 IRB 框架下进行,且未收集任何个人可识别信息(如电话号码、IMEI 和 IMSI),无法将收集的信息与用户真实身份关联。
3. 测量结果
3.1 总体统计
借助 70965549 台使用 34 种不同型号手机的 Android - MOD 用户设备的众包帮助,记录了 2315314213 次蜂窝故障的系统