Hadoop周辺の設定メモ - 11/02/2023

雑記録

Hadoop


hive関連

keydefault valueabout
hive.tez.container.size-1tezのコンテナを使うメモリサイズ
hive.tez.auto.reducer.parallelismfalsereducerの並列有効化
hive.exec.reducers.bytes.per.reducer256,000,0001つのreducer辺りの処理サイズ
hive.exec.dynamic.partition.modestricdynamic partitionを使用するときのモード。stricの場合partitionをselectで明示的に指定しなければいけない。
hive.exec.compress.outputfalsequeryの最終結果を圧縮するかどうかを決める。圧縮方式は「mapred.output.compress*」から取得

mapreduce関連

keydefault valueabout
mapred.reduce.tasks-1Hadoopジョブで使用するReduceタスク数
mapred.output.compression.codecHadoopジョブの主力するファイルを圧縮するときのCodecのClass
mapreduce.output.fileoutputformat.compress.codec

hdfs(NameNode)関連

keydefault valueabout
io.compression.codecs使用できる圧縮するときのCodecのclass

tez関連

keydefault valueabout
tez.queue.nametezのqueue名
tez.tez-ui-history-url.basehttp://<webserver-host:9999/tez-ui/TezUIのホスト
tez.am.view-aclsView権限を与えるacl

share on twitter suggests change