第6.1章:StarRocks tablet巡检工具(拓展篇)
规范使用StarRocks非常重要的一个环节就是合理分桶,在集群中数据量非常大时,不恰当的分桶带来的负面影响尤为明显。比如,分桶过多会导致BE元数据占用内存过高且影响查询效率,分桶过少可能会引起Compaction压力过大、影响查询并行度,甚至某些情况下还会导致查询报错。在当前设计下,衡量分桶是否规范的唯一标准就是数据量,将每个tablet的数据量控制在100M-1G左右,是比较推荐的。这里说的数据量是指压缩后的数据量,StarRocks是列存,使用LZ4压缩,压缩率根据数据类型和数据情况的不同