既要做 OLAP分析,又要模糊查询

  • 限定时间,跨度少则几分钟,几小时,大则跨年,多条件查询,条件有可能包含主键,也有可能是非主键。譬如一个号码既要查A字段,也要查B字段。多个号码同时查。
  • 模糊查询文本字段
  • 对查寻结果做 group by ,order by操作,在create table as 建表,数据集大小可能有千万,上亿

性能当然越快越好。

1.确认下您的数据需要更新嘛?
2.跨时间段的查询建议可以分区,查询的时候可以分区裁剪减少数据扫描
3.非主键和group by、order by可以考虑物化视图,物化视图可以调整sort key顺序(可以与base表不一样),另外也有预聚合,会有性能提升
4.对于号码多个字段查询的,高基数的情况下可以考虑bloomfilter索引。

这个在当前的版本中还不支持,但应该是会在后续版本中增加。