CPU简述

CPU架构、高速缓存、存储器

nieo nieo 发布于 2017-06-04

Yarn运行日志管理

Yarn运行日志管理主要是NodeManager中Executor任务执行日志的管理。

nieo nieo 发布于 2017-05-14

Yarn分布式缓存机制

Yarn设计有一种分布式缓存机制,把资源文件缓存到NodeManager,可以加速任务启动过程。

nieo nieo 发布于 2017-05-13

Hive文件存储格式压缩性能对比

不同的Hive文件存储格式与压缩算法组合之后的计算效率压缩性能有较大差异。

nieo nieo 发布于 2017-05-07

Hive文件存储格式——Parquet

Parquet是一种新型列式存储格式。

nieo nieo 发布于 2017-04-30

Hive文件存储格式——ORC

ORC全称为Optimized Row Columnar,优化列式存储。

nieo nieo 发布于 2017-04-29

Hive文件存储格式——AVRO

Avro是一个数据序列化系统,设计用于支持大批量数据交换的应用。

nieo nieo 发布于 2017-04-23

Hive文件存储格式——SequenceFile

SequenceFile是Hadoop提供的一种二进制文件支持,具有使用方便、可分割、可压缩的特点。

nieo nieo 发布于 2017-04-22

Hive文件存储格式

Hive存储格式表示表数据在文件中的组织形式。

nieo nieo 发布于 2017-04-19

Hive压缩格式

Hive压缩格式也压缩算法

nieo nieo 发布于 2017-04-16