Rockchip RK3588启动流程：aarch64架构全面讲解-程序员充电站

深入理解 RK3588 启动流程：从上电到 aarch64 内核的完整旅程

你有没有遇到过这样的情况？板子通电后串口毫无动静，或者 U-Boot 能跑起来但内核死活不启动。面对这些问题，大多数人第一反应是“刷错镜像了”或“DDR 配置不对”，可真正的原因往往藏得更深——就在那条看不见的启动链中。

今天，我们就以 Rockchip RK3588 为例，彻底拆解一颗高端 aarch64 SoC 是如何从一个复位信号，一步步建立起完整的操作系统环境的。这不仅是一次技术剖析，更是一场嵌入式底层世界的深度探险。

上电之后的第一步：CPU0 去哪取指令？

一切始于电源稳定后的第一个时钟周期。RK3588 的 CPU0（主核）会从物理地址0x0000_0000开始取指执行。这个地址不是映射到外部 Flash 或 DDR，而是被硬连线到芯片内部的一块 Mask ROM——这就是整个信任链的起点，也被称为BL1（Boot Loader Stage 1）。

这块 ROM 是厂商在制造阶段就固化进去的，用户无法修改，因此它具备天然的信任属性。它的任务非常明确：

初始化 PLL，建立基本系统时钟；
根据硬件 STRAP 引脚电平判断启动优先级（比如 SD 卡 > eMMC > USB）；
尝试从这些介质加载下一阶段引导程序（通常是 BL2）；
如果所有设备都无效，则进入 USB 下载模式，等待主机通过rkdeveloptool烧录固件。

最关键的是，此时 CPU 运行在EL3 异常等级 + aarch64 执行状态。这是 ARMv8-A 架构中权限最高的运行模式，专为安全初始化设计。你可以把它想象成系统的“总工程师”，只有它有权决定接下来谁可以进场施工。

💡小知识：为什么叫 EL3？ARMv8 定义了四个异常等级（Exception Level），EL0 最低（用户程序），EL3 最高（安全监控）。RK3588 启动时直接跳入 EL3，意味着从一开始就站在了控制全局的位置。

BL1 加载完 BL2 后，并不会释放控制权，而是将执行流跳转过去。而 BL2 的落脚点通常是在片上 SRAM（SARAM），例如0xff72_0000附近。这样做是为了避开一个致命问题：外部 DDR 尚未初始化，根本不能用。

ATF 接棒：BL2 如何构建可信世界的基础？

接下来登场的是ARM Trusted Firmware-A（TF-A）中的 BL2，它是开源社区与芯片厂商协作的关键环节。

BL2 依旧运行在EL3、aarch64 模式下，但它不再只是个搬运工，而是开始搭建系统的骨架。它的核心职责包括：

解析 FIP（Firmware Image Package）镜像包；
初始化中断控制器 GIC-600（支持 GICv3 架构）；
注册 PSCI（Power State Coordination Interface）服务；
准备上下文并移交控制给 BL31。

FIP 镜像是什么？

你可以把 FIP 看作是一个“固件集装箱”，里面打包了多个关键组件：

组件	说明
BL2	当前阶段自身
BL31	EL3 Runtime Firmware（安全监控）
BL32	可选 TEE OS（如 OP-TEE）
BL33	非安全世界入口（U-Boot）

BL2 的主要工作就是打开这个箱子，把每个部件放到正确的位置，并通知后续阶段：“我已经准备好了”。

void bl2_main(void) { bl2_plat_arch_setup(); // 初始化运行环境 fip_load_images(); // 解析 FIP，定位各镜像 plat_gic_init(); // 初始化 GIC 中断 psci_register_spd(&psci_rk_spd_pm); // 注册电源管理驱动 return bl2_jump_to_next_image(); // 跳转至 BL31 }

这段代码看似简单，实则每一步都至关重要。尤其是fip_load_images()，如果解析失败，整个启动过程就会卡在这里，连串口输出都没有。

⚠️坑点提醒：很多开发者烧录时只关注u-boot.img，却忽略了idbloader.img（即 BL2 + BL31 的合并镜像）。一旦这个文件损坏或版本不匹配，MaskROM 虽然能加载成功，但系统会在几毫秒内崩溃，表现为“串口无输出”。

此外，BL2 必须在 DDR 初始化之前完成运行，因此它早期依赖 SARAM。这也是为什么 TF-A 在编译时需要指定内存布局（memory map），确保代码和数据不会越界。

安全中枢上线：BL31 如何掌控 EL3 Runtime？

当 BL2 完成使命后，控制权交给了BL31——ATF 提供的运行时固件，也是整个 TrustZone 安全架构的核心枢纽。

BL31 依然驻留在EL3，但它不再是临时工，而是长期值守的“安保指挥中心”。它的主要功能包括：

处理来自非安全世界的 SMC（Secure Monitor Call）请求；
管理 CPU 电源状态（开机、关机、挂起）；
配置 TZASC（TrustZone Address Space Controller）保护安全内存区域；
设置 MMU 和页表，启用虚拟地址映射；
最终退出 EL3，跳转至非安全世界（BL33，即 U-Boot）。

SMC 是怎么工作的？

SMC 类似于系统调用（syscall），只不过发生在安全与非安全世界之间。例如 Linux 内核想关闭某个 CPU 核心，就会发出一条 SMC 指令，触发异常进入 EL3，由 BL31 中注册的处理函数来执行实际操作。

static const psci_ops_t rk_psci_ops = { .pwr_domain_on = plat_rk_cpu_on, .pwr_domain_off = plat_rk_cpu_off, .cpu_standby = plat_rk_cpu_standby, .system_reset = plat_rk_system_reset, }; int plat_setup_psci_ops(uintptr_t sec_entrypoint, const psci_ops_t **ops) { *ops = &rk_psci_ops; return 0; }

上面这段代码注册了平台相关的电源管理接口。当操作系统调用cpu_power_down()时，最终会落到plat_rk_cpu_off函数上。这种机制让上层软件无需关心底层寄存器细节，也能完成复杂的电源控制。

💡经验之谈：如果你在调试多核启动时发现辅核无法唤醒，大概率是 PSCI 配置有问题，或者是 BL31 没有正确广播启动向量。

还有一点特别重要：BL31 必须永远保留在内存中。它不能像普通程序那样被操作系统回收。否则一旦发生 SMC 调用，系统将因找不到处理程序而崩溃。

进入非安全世界：U-Boot 是如何被唤醒的？

经过前三阶段的努力，安全基础已经打好。现在轮到BL33登场了 ——在绝大多数情况下，这就是我们熟悉的U-Boot。

BL31 通过el3_exit()指令退出 EL3，并根据预先设置的entry_point_info结构跳转到 U-Boot 的入口地址（如0x0008_0000）。此时的目标异常等级由配置决定：

若设为NON_SECURE_EL2，U-Boot 以 Hypervisor 模式运行，适用于虚拟化场景；
默认为NON_SECURE_EL1，即传统 bootloader 模式。

U-Boot 接管后，才真正开始对外设进行详细初始化：

配置串口用于打印调试信息；
初始化 DDR 控制器，启用大容量内存；
驱动 PMIC，调整电压域；
加载内核镜像、设备树（DTB）、initramfs；
设置启动参数（bootargs）；
最终通过booti命令跳转至 Linux 内核。

aarch64 下的特殊要求

由于现代 Linux 内核要求运行在 aarch64 模式下，U-Boot 自身也必须使用 aarch64 工具链编译，并满足以下条件：

支持加载压缩内核镜像（Image.gz）或 EFI 格式；
正确解析.dtb设备树文件；
使用设备树传参，禁用旧式的 ATAGS 方式；

典型的启动命令如下：

setenv bootargs "console=ttyS2,1500000 earlycon root=/dev/mmcblk1p5 rootfstype=ext4" load mmc 1:1 0x0008_0000 Image load mmc 1:1 0x0009_0000 rk3588-rock-5b.dtb booti 0x0008_0000 - 0x0009_0000

其中booti是专门为 aarch64 设计的启动命令，参数顺序为：内核地址、initrd 地址（“-”表示无）、设备树地址。

⚠️常见错误：有人习惯把内核加载到低位内存（如0x0008_0000），但这可能与 U-Boot 自身重叠。推荐做法是使用高位地址（如0x8000_0000以上），避免冲突。

实战排错指南：那些年我们踩过的坑

再完美的理论也敌不过现实的残酷。以下是两个典型故障及其排查思路。

❌ 问题一：串口完全无输出

现象：上电后串口静默，USB 下载模式也无法识别。

分析路径：
1. 先确认供电是否正常，特别是 VCC_DDR 和 VCC_LOG 是否达到标称值；
2. 查看 STRAP 引脚电平是否符合预期（可用万用表测量）；
3. 使用rkdeveloptool ld列出当前设备状态，判断是否进入 MaskROM 模式；
4. 若能识别，尝试重新烧写idbloader.img和uboot.img；
5. 若仍无效，可能是 SPI CLK 相位/极性配置错误，或是 NAND/eMMC 硬件故障。

✅秘籍：某些开发板需要按下特定按键组合才能强制进入下载模式，别忘了查原理图！

❌ 问题二：U-Boot 能启动，但内核卡住不动

现象：U-Boot 正常打印，加载内核成功，但booti后无任何响应。

可能原因：
- 设备树与硬件不符（如 GPIO 编号错误、clock 配置缺失）；
- 内核未开启CONFIG_ARM64支持；
- 内核镜像地址与 U-Boot 冲突；
- MMU 配置不当导致地址映射混乱。

解决方法：
1. 添加earlyprintk参数，观察内核最早输出的信息；
2. 使用fdt addr <dtb_addr>检查设备树加载位置是否合法；
3. 确保内核配置中启用了ARCH_ROCKCHIP和SOC_RK3588；
4. 尝试使用已知可用的参考设备树进行替换测试。

架构全景图：RK3588 启动链全貌

完整的启动链条可以用一句话概括：

从 MaskROM 出发，在 EL3 上借助 ATF 搭建安全框架，最终将控制权平稳移交至非安全世界的 U-Boot 与 Linux 内核。

其流程如下：

[Power On] ↓ MaskROM (BL1, EL3, aarch64) ↓ ATF BL2 → BL31 (EL3 Runtime) → [BL32 OP-TEE] → BL33 (U-Boot) ↓ Linux Kernel (EL1, aarch64) ↓ RootFS + Application

每一环都有明确分工：
- BL1：信任根，不可篡改；
- BL2：解析镜像，初始化关键外设；
- BL31：安全守门人，处理跨世界调用；
- U-Boot：通用引导程序，对接操作系统；
- Kernel：接管系统，启动用户空间。

工程实践建议：如何打造可靠又快速的启动系统？

了解原理之后，我们该如何应用到实际项目中？

🔐 安全启动（Secure Boot）

对于工业或金融类设备，必须启用安全启动：
- 熔断 eFUSE 启用硬件加密引擎；
- 使用 RSA-2048 对各阶段镜像签名；
- BL1 验证 BL2，BL2 验证 BL31，形成完整信任链；
- 防止非法固件刷入，提升抗攻击能力。

🔄 双系统冗余 + OTA 回滚

为提高系统可靠性，可在 eMMC 上划分两个完整系统分区：
- 主系统运行，副系统待命；
- OTA 升级时先写入备用分区；
- 验证通过后再切换启动目标；
- 若新系统异常，自动回退至上一版本。

⚡ 快速启动优化技巧

若产品对启动时间敏感（如智能音箱、车载显示），可采取以下措施：
- 裁剪 BL2/BL31/U-Boot 功能，仅保留必要模块；
- 使用 fastboot 替代完整 U-Boot，节省数百毫秒；
- 启用 DDR 自刷新模式，避免每次冷启动重新训练；
- 将内核和 DTB 打包进 idbloader，减少存储访问次数。