无聊未来

文章
8
资源
0
加入时间
2年10月24天

clickhouse 速度快的原因-小结

1.clickhouse是一个列式存储的数据库,每一列数据都经过了lz4的压缩,由于列数据之间重复性极高,所以拥有非常可观的压缩比,这样查询一列数据时,扫描速度极快2.cpu指令层面的优化,大量使用了向量化的操作的指令,也就是SIMD指令(单指令多数据),并且非常善于利用cpu的L1,L2,L3缓存,尽量减少读取内存或者磁盘的操作.3.不同的场景使用不同的算法或者数据结构,比如数据量较小时就是用array数组存储,数据中等大小时就用hashset结构存储,数据量庞大时使用hyperloglog结