Rockset对比


发布于 2024-08-29 / 26 阅读 / 0 评论 /
Rockset是一个商业化产品,是最快的搜索和实时分析工具。

1.Rockset简介

Rockset官网介绍为:World's fastest search and analytics database. Measuring end-to-end latency with streaming ingest and high QPS workload.

直接把Rockset定义为世界上最快的搜索和分析型数据库。这个快是通过测量流式摄取和高QPS工作负载情况下端到端延迟来表现的。

在90MB/s的数据摄取、20000 QPS的环境下,95%的查询延迟都在70ms内。相关数据参考https://rockset.com/blog/20k-qps-on-rockset/

Rockset的工作架构如下图所示:

下面的对比也是基于此架构。

2.Rockset vs Elasticsearch

经测试,Rockset相对Elasticsearch有以下几点显著优势:

2.1.摄取速度快4倍

摄入大量事件流和CDC流。Rockset的聚合索引在字段级别是可变的,可进行高效地upsert操作。通过摄取计算和查询计算之间的完全隔离,实现更好的扩展性能。

2.2.基础设施成本降低44%

通过计算-存储和计算-计算分离消除硬件过度供应。隔离不需要副本。在单个实时数据集上运行多个应用程序。

2.3.开发效率提升20倍

Elasticsearch是为数据中心时代构建的,要求持续的容量规划、集群管理、重新索引和重新分片。使用Rockset完全托管的云原生实时分析数据库,部署实时分析的速度提高了20倍。

2.4.支持各种SQL Joins操作

使用Rockset的高效计算聚合索引运行标准SQL,包括深度嵌套JSON上的复杂JOIN。不需要非标准化。Elasticsearch中缺乏高性能的JOIN是一个巨大的限制。

3.Rockset vs Clickhouse

经测试,Rockset相对Clickhouse有以下几点优势:

3.1.查询速率快1.7倍

根据Star Schema Benchmark的结果,在相同的硬件配置下,Rockset比ClickHouse快1.67倍。

3.2.开发效率提升20倍

ClickHouse需要配置节点、分片、软件版本、副本等。Rockset是一个完全托管的云原生数据库,可最大限度地减少运营负担和持续维护。

3.3.基础设施成本降低50%以上

Rockset将存储、摄取计算、查询计算分开,因此不需要为工作负载过度分配资源。此外,Rockset的聚合索引具有很高的计算效率。

3.4.支持复杂的SQL Joins操作

Rockset以高效的方式支持完整的SQL,包括join语法。在ClickHouse中,join不是一等公民,而且它们的成本非常高,因此我们需要使用增加数据模型复杂性的解决方法。