彩虹农场
Rainbow Farm
首页
笔记
图片
查字
英语
[
Tez基础
]
[
(思维导图)
] (1949)
-隐藏-
引擎 配置
+展开+
hive.execution.engine
执行引擎选择,使用tez引擎时,此值设 ...
yarn.timeline-service.enabled
是否使用timeline服务,使用ti ...
hive.tez.log.level
设置Tez Task的日志级别,默认是 ...
内存 配置
+展开+
tez.am.resource.memory.mb
默认值128,Application ...
tez.am.launch.cmd-opts
Tez AppMaster进程启动期间 ...
hive.tez.container.size
默认值128,Tez AppMaste ...
hive.tez.java.opts
container进程启动期间提供的命 ...
tez.container.max.java.heap.fraction
默认值0.8,0.8,如果hive.t ...
tez.runtime.io.sort.mb
默认值512,排序输出时的排序缓冲区大 ...
hive.auto.convert.join.noconditionaltask.size
默认值10000000,如果hive. ...
Map 数量
Tez 确定任务的数量,以使每个任务的 ...
+展开+
tez.grouping.min-size
min-size默认16 MB
tez.grouping.max-size
max-size默认1 GB
tez.grouping.split-count
指定分组的数据量,指定之后忽略前两个参 ...
Reduce 数量
+展开+
hive.tez.auto.reducer.parallelism
默认值false,打开Tez的redu ...
hive.exec.reducers.max
设置reducer最大值,默认1009。 ...
reducer 数量预估
预估公式:Hive和Tez都使用此公式 ...
tez.min.partition.factor
默认值0.25,
tez.max.partition.factor
默认值2.0,增加此值可以增加Redu ...
tez.shuffle-vertex-manager.min-src-fraction
默认值0.252,
tez.shuffle-vertex-manager.max-src-fraction
默认值2,
tez.shuffle-vertex-manager.[min|max]-src-fraction
这两个值效果一致,增加该值则reduc ...
mapred.reduce.tasks
人工设置reduce数量,
总结
不建议使用mapred.reduce. ...
hive.tez.[min|max].partition.factor
增加此值可以增加Reduce数量,减少 ...
并发设置
+展开+
hive.server2.tez.default.queues
Tez会话池的YARN队列,用逗号分割。 ...
hive.server2.tez.sessions.per.default.queue
每个YARN队列在池中的Tez会话数( ...
hive.server2.tez.initialize.default.sessions
初始化默认会话,如果启用,HiveSe ...
容器重用和预热容器
+展开+
容器重用
这是一种限制启动时间对容器的影响的优化。 ...
+展开+
tez.am.container.reuse.enabled
设置为ture,表示打开,
预热容器
+展开+
hive.prewarm.enabled
设置是否开启预热容器
hive.prewarm.numcontainers
设置预热容器数量
通用参数
+展开+
hive.cbo.enable
设置true开启基于成本的优化 (CB ...
hive.auto.convert.join
设置开启map join自动转换,tr ...
hive.auto.convert.join.noconditionaltask
设置无条件map join转换,
tez.runtime.io.sort.mb
设置输出排序时排序缓冲区的大小。建议设 ...
tez.runtime.unordered.output.buffer.size-mb
设置输出不需要排序时的内存。如果不直接 ...
hive.exec.parallel
设置启用Hive查询阶段的并行执行。默 ...
hive.vectorized.execution.enabled
设置矢量化查询执行,矢量化查询是Hiv ...
hive.merge.tezfiles
设置是否合并文件,默认false。设置 ...
hive.merge.size.per.task
设置作业结束时合并文件的大小。
hive.merge.smallfiles.avgsize
当平均输出文件大小小于此数字时,Hiv ...
tez.am.session.min.held-containers
预留最少的container数量,空闲 ...
hive.mapjoin.hybridgrace.hashtable
是否使用混合的操作完成mapjoin, ...
tez.runtime.pipelined.sorter.lazy-allocate.memory
对Tez任务中是否开启软引用的内存惰性 ...
hive.stats.autogather
是否开启自动收集统计信息,可以根据an ...
hive.stats.fetch.column.stats
是否开启获取列的统计信息,可以根据an ...
hive.compute.query.using.stats
是否开启计算查询使用表的统计信息,可以 ...
hive.optimize.skewjoin
是否开启join的数据倾斜优化,根据业 ...
hive.groupby.skewindata
是否开启groupby的数据倾斜优化, ...
tez.session.am.dag.submit.timeout.secs
Tez的session模式下,AM退出 ...
MR和Tez
对于DAG作业,MR会创建多个有依赖关 ...
链接: