主键索引:
1、主键过多使用MD5(联合主键)。
2、主键索引的第⼀个字段⼀定是最⻓查询的字段,并且需要是⾼基字段。这⾥⾯选取分区分桶外最⻓查询且⾼基数的列。
前缀索引:
1、前缀索引中的字段⻓度尽可能明确,因为Doris只有前36个字节能⾛前缀索引。
2、最好3个字段内。
分区:
1、大数据量查询:1个分区对应1个tablet,确保每个tablet⼤⼩为256MB512MB之间,或者每个tablet数据量在50w条100w条之间。
2、2000kw以内数据禁⽌使⽤动态分区。
3、对于有⼤量历史分区数据,但是历史数据⽐较少,或者不均衡,或者查询概率的情况,通过PARTITION将数据放在特殊分区。
分桶:
1、5亿以上的数据必须设置分区分桶策略。
2、如果分桶字段存在30%以上的数据倾斜,则禁⽌使⽤Hash分桶策略,改使⽤random分桶策略。