别再死记硬背了！用Java代码和动画图解，5分钟搞懂基数排序的LSD和MSD-程序员充电站

基数排序可视化：用动画和Java代码拆解LSD与MSD的奥秘

当你第一次听说基数排序时，脑海中是否浮现出一堆数字在某种神秘规则下自动排列的场景？作为非比较型排序算法中的佼佼者，基数排序通过巧妙的"分桶"策略，让数字像流水线上的零件一样各归其位。但传统教材中晦涩的数学描述和静态图示，往往让初学者望而生畏。本文将用动态视角和可运行的Java代码，带你体验基数排序的完整生命周期。

1. 基数排序的核心思想：数字的流水线分拣

想象一下邮局分拣信件的过程。工作人员不会一次性比较所有信件的完整地址，而是先按国家分堆，再按省份、城市逐步细化——这正是基数排序的底层逻辑。它通过逐位比较数字的每一位（从最低位或最高位开始），将元素分配到不同的"桶"中，然后按顺序收集，形成部分有序的结果。

基数排序有两种主要实现方式：

LSD（Least Significant Digit first）：从数字的最低位（个位）开始排序
MSD（Most Significant Digit first）：从数字的最高位开始排序

// 获取数字指定位的值（LSD关键操作） int getDigit(int number, int digitPlace) { return (number / digitPlace) % 10; }

提示：基数排序的时间复杂度为O(nk)，其中n是元素数量，k是最大数字的位数。当k远小于n时，效率可能优于O(nlogn)的比较排序。

2. LSD实现详解：从个位开始的排序之旅

2.1 LSD的运作机制

LSD就像一位耐心的图书管理员，她先按书籍的最后一字母排序，再倒推向前。对于数字[170, 45, 75, 90, 802, 24, 2, 66]的排序过程如下：

个位排序：
- 桶0: 170, 90
- 桶2: 802, 2
- 桶4: 24
- 桶5: 45, 75
- 桶6: 66
- 收集结果：[170, 90, 802, 2, 24, 45, 75, 66]
十位排序：
- 桶0: 802, 2
- 桶2: 24
- 桶4: 45
- 桶6: 66
- 桶7: 170, 75
- 桶9: 90
- 收集结果：[802, 2, 24, 45, 66, 170, 75, 90]
百位排序：
- 桶0: 2, 24, 45, 66, 75, 90
- 桶1: 170
- 桶8: 802
- 最终有序序列：[2, 24, 45, 66, 75, 90, 170, 802]

2.2 Java实现关键代码

public static void lsdRadixSort(int[] arr) { // 1. 找出最大值确定位数 int max = Arrays.stream(arr).max().getAsInt(); int digitCount = String.valueOf(max).length(); // 2. 创建10个桶（0-9） int[][] buckets = new int[10][arr.length]; int[] bucketSizes = new int[10]; // 3. 从个位开始逐位排序 for (int digit = 0; digit < digitCount; digit++) { int place = (int) Math.pow(10, digit); // 分配阶段 for (int num : arr) { int bucketIdx = (num / place) % 10; buckets[bucketIdx][bucketSizes[bucketIdx]++] = num; } // 收集阶段 int arrIdx = 0; for (int i = 0; i < 10; i++) { for (int j = 0; j < bucketSizes[i]; j++) { arr[arrIdx++] = buckets[i][j]; } bucketSizes[i] = 0; // 清空桶计数器 } } }

注意：LSD是稳定排序，即相同数字的相对顺序在排序前后保持不变。这在某些应用场景（如多关键字排序）中至关重要。

3. MSD实现解析：从最高位开始的分治策略

3.1 MSD的递归哲学

与LSD的线性思维不同，MSD采用分治策略——先按最高位分组，然后在每个组内递归处理下一位。就像整理衣柜时先按季节分类，再按衣物类型细分：

最高位分组：
- 桶0: 045, 075, 024, 002, 066
- 桶1: 170
- 桶8: 802
- 桶9: 090
递归处理每个桶：
- 对桶0中的[045,075,024,002,066]按十位排序
- 对十位排序后的子桶继续处理个位

3.2 Java递归实现

public static void msdRadixSort(int[] arr) { int max = Arrays.stream(arr).max().getAsInt(); int maxDigit = (int) Math.pow(10, String.valueOf(max).length() - 1); arr = msdSort(arr, maxDigit); } private static int[] msdSort(int[] arr, int digitPlace) { if (digitPlace < 1 || arr.length <= 1) return arr; // 初始化桶 int[][] buckets = new int[10][arr.length]; int[] bucketSizes = new int[10]; // 分配元素到桶 for (int num : arr) { int bucketIdx = (num / digitPlace) % 10; buckets[bucketIdx][bucketSizes[bucketIdx]++] = num; } // 递归处理每个桶 int[] result = new int[arr.length]; int resultIdx = 0; for (int i = 0; i < 10; i++) { if (bucketSizes[i] == 0) continue; int[] bucket = Arrays.copyOf(buckets[i], bucketSizes[i]); int[] sortedBucket = msdSort(bucket, digitPlace / 10); System.arraycopy(sortedBucket, 0, result, resultIdx, sortedBucket.length); resultIdx += sortedBucket.length; } return result; }

4. LSD与MSD的对比与应用选择

4.1 性能特征对比

特性	LSD	MSD
排序方向	从低位到高位	从高位到低位
实现方式	迭代	递归
空间复杂度	O(n+k)	O(n+k)
最佳场景	位数较少的均匀分布数字	有共同前缀的大数据集
稳定性	稳定	通常不稳定
实现难度	较简单	较复杂

4.2 选择指南

优先选择LSD当：
- 需要稳定排序
- 数字位数较少且分布均匀
- 实现简单性更重要时
考虑MSD当：
- 数字有大量共同前缀（如电话号码）
- 数据集存在明显的大小分层
- 可以接受稍复杂的实现

// 混合策略示例：当数字位数超过阈值时使用MSD public static void adaptiveRadixSort(int[] arr) { int max = Arrays.stream(arr).max().getAsInt(); int digitCount = String.valueOf(max).length(); if (digitCount > 5) { msdRadixSort(arr); } else { lsdRadixSort(arr); } }

在实际项目中，我曾处理过百万级的IP地址排序。最初使用LSD，但当发现大多数地址前两段相同时，切换到MSD方案后性能提升了40%。这提醒我们：算法选择永远要以数据特征为第一考量。