Yarn RPC通信框架

Yarn中各个组件之间RPC通信接口介绍,本文基于hadoop3.3.4版本

nieo nieo 发布于 2024-08-17

Open Data Catalog

数据驱动和 AI 时代 Open Data Catalog 的重要性

nieo nieo 发布于 2024-08-17

Presto发布版本历程

Presto的发布版本内容和发布时间历程

nieo nieo 发布于 2024-08-15

Trino发布版本历程

Trino的发布版本内容和发布时间

nieo nieo 发布于 2024-08-15

Yarn任务提交和任务执行流程

Yarn是Hadoop的资源管理器,提交任务和任务执行是Yarn最基本的流程。 本文基于Hadoop3.3.4版本

nieo nieo 发布于 2024-08-13

Spark Executor结束状态传递过程

探索Spark Executor在任务执行过程中的状态传递

nieo nieo 发布于 2024-08-12

Elasticsearch发布版本历程

Elasticsearch发布版本内容和发布时间

nieo nieo 发布于 2024-08-11

Kafka的分层存储是否是成本和弹性的新解决方案

分层存储是Kafka3.6.0实现的新特性,用于解决数据日益增长后的扩展性、效率和可操作性的问题。

nieo nieo 发布于 2024-08-10

Kafka日志清理机制

本文基于kafka3.6.0源码,描述kafka日志段的清理机制

nieo nieo 发布于 2024-08-08

Kafka分区副本同步机制

本文基于kakfa1.0.0,从源码层面解析Kafka分区副本的同步机制

nieo nieo 发布于 2024-08-07