本文参考https://clickhouse.com/use-cases/
主要有以下四种使用场景。
1.实时数据分析
每秒摄入数百万行数据,最重的工作负载,这些都不会影响查询速率。
实时数据库真正需要在数据规模上大放异彩,当延迟很重要时,可以依靠出色的性能。
ClickHouse支持实时数据分析场景中的以下功能:
(1)创建具有即时响应能力的面向用户的仪表板和应用程序
(2)利用最新数据驱动明智的商业决策
(3)在最多样化、高基数的数据集上轻松运行基于SQL的分析
(4)无缝集成来自各种来源的静态或流式数据
(5)使用我们喜欢的可视化工具,如Grafana、Tableau、Superset等
基于ClickHouse实时分析的业务架构如下图所示:
无论您是构建面向用户的仪表板、即时响应的应用程序,还是动态分析数据,ClickHouse都能满足您的需求。我们的设计是为了确保即使是最复杂的数据分析也可以使用简单的SQL直观地完成。
我们的并行查询执行引擎、一流的压缩率和面向列的设计在规模上提供了无与伦比的性能,使您可以专注于洞察力,而不用担心基础设施。
2.机器学习和生成式AI
为机器学习工作负载提供动力的终极实时数据库。有了ClickHouse,在分析数据基础上自动生成内容将比以往任何时候都更容易。
ClickHouse在机器学习上的功能点在于以下五点:
(1)通过消除对ML特定数据存储的需求来简化数据堆栈
(2)使用闪电般快速的聚合进行数据准备,为PB级的模型训练提供动力
(3)使用线性和近似技术执行快速高效的向量搜索
(4)直接从任何供应商那里购买即插即用的预构建模型
(5)通过我们广泛的集成套件,使用我们喜欢的机器学习工具进行开发
基本架构如下图所示:
ClickHouse是专门为从复杂数据中轻松获取结论而构建的。无论你处理多少数据。无论您是通过聚合为模型训练和评估提取有价值的信息,通过我们的用户定义函数运行推理,还是执行向量搜索,ClickHouse都能让您最大限度地提高数据效率,并为任何应用程序释放AI的力量。
3.BI商业智能
告别加载微调器和漫长的报告等待时间。对于商业智能,ClickHouse以极低的成本解锁更快的查询。
在数据仓库上运行传统的BI工具进行分析可能成本高昂,并且通常会导致性能和并发性限制。公司利用ClickHouse作为其实时数据仓库,以确保分析和商业智能在任何规模上都能大放异彩。
基于ClickHouse的BI应用,典型的架构设计如下图所示:
4.日志事件跟踪系统
使用业界领先的压缩比、亚秒级查询响应时间、强大的聚合功能和广泛的集成套件来转换您的日志、事件和链路跟踪。
ClickHouse提供了为任何规模的可视化平台提供所需的成本效益和超快速度。
当涉及到基于SQL的分析时,ClickHouse的亮点在于它能够对大量数据执行大量分析功能——利用高压缩率等特性来确保大规模的稳健性能。解决方案基本架构如下图所示: