严格模式主要是保证任务的执行完去按照我们的设计来完成,不出纰漏。
Hive中可同时执行多个Stage,这就是并行执行优化。
本地模式优化主要适应输入数据集比较小的场景。
Hive在一些简单的Select查询时,可以使用Fetch抓取优化。
在特殊场景下,通过矢量查询能更快得到结果。
谓词相当于Hive SQL中的过滤条件,下推表示前移。
CBO全称为Cost Based Optimizer,基于计算成本的优化。
针对Hive SQL进行优化。
根据Hive SQL的执行计划进行调优
从计算资源角度分析Hive任务执行过程可能调优的点。