1.Rockset简介
Rockset官网介绍为:World's fastest search and analytics database. Measuring end-to-end latency with streaming ingest and high QPS workload.
直接把Rockset定义为世界上最快的搜索和分析型数据库。这个快是通过测量流式摄取和高QPS工作负载情况下端到端延迟来表现的。
在90MB/s的数据摄取、20000 QPS的环境下,95%的查询延迟都在70ms内。相关数据参考https://rockset.com/blog/20k-qps-on-rockset/
Rockset的工作架构如下图所示:
下面的对比也是基于此架构。
2.Rockset vs Elasticsearch
经测试,Rockset相对Elasticsearch有以下几点显著优势:
2.1.摄取速度快4倍
摄入大量事件流和CDC流。Rockset的聚合索引在字段级别是可变的,可进行高效地upsert操作。通过摄取计算和查询计算之间的完全隔离,实现更好的扩展性能。
2.2.基础设施成本降低44%
通过计算-存储和计算-计算分离消除硬件过度供应。隔离不需要副本。在单个实时数据集上运行多个应用程序。
2.3.开发效率提升20倍
Elasticsearch是为数据中心时代构建的,要求持续的容量规划、集群管理、重新索引和重新分片。使用Rockset完全托管的云原生实时分析数据库,部署实时分析的速度提高了20倍。
2.4.支持各种SQL Joins操作
使用Rockset的高效计算聚合索引运行标准SQL,包括深度嵌套JSON上的复杂JOIN。不需要非标准化。Elasticsearch中缺乏高性能的JOIN是一个巨大的限制。
3.Rockset vs Clickhouse
经测试,Rockset相对Clickhouse有以下几点优势:
3.1.查询速率快1.7倍
根据Star Schema Benchmark的结果,在相同的硬件配置下,Rockset比ClickHouse快1.67倍。
3.2.开发效率提升20倍
ClickHouse需要配置节点、分片、软件版本、副本等。Rockset是一个完全托管的云原生数据库,可最大限度地减少运营负担和持续维护。
3.3.基础设施成本降低50%以上
Rockset将存储、摄取计算、查询计算分开,因此不需要为工作负载过度分配资源。此外,Rockset的聚合索引具有很高的计算效率。
3.4.支持复杂的SQL Joins操作
Rockset以高效的方式支持完整的SQL,包括join语法。在ClickHouse中,join不是一等公民,而且它们的成本非常高,因此我们需要使用增加数据模型复杂性的解决方法。