本文基于Hadoop-3.5.0,解读Yarn的状态机
Knox代理Spark History WebUI的问题
通过Yarn Client模式提交Spark任务,任务结束后,driver进程无法结束,一直阻塞。如果大量提交Spark任务,服务器中就会有大量的SparkSubmit进程,最终导致机器内存溢出。
大数据面试过程有关HDFS的常见面试题
Yarn基础架构和高可用架构
HDFS架构经历过几次挑战
HDFS作为文件系统,读和写是最基本的流程。
走进Hadoop社区,看看Hadoop发布版本历程
Spark各发布版本的发布时间和官方文档说明
Hive各发布版本的时间