2018-10-20
閱讀量:
1244
如何確定map的個數?
(1)一個文件HDFS中的file,占用3個block塊,每塊默認64M,這個是物理切分。
(2)運行map的時候,根據配置文件進行split切分,這是邏輯切分。
(3)一個split就會對應運行一個map。
hdfs-site.xml中設置
<property>
<name>dfs.block.size</name>
<value>n0</value>
</property>
mapred-site.xml中設置
<property>
<name>mapred.max.split.size</name>
<value>n1</value>
</property>
<property>
<name>mapred.min.split.size</name>
<value>n2</value>
</property>
那么: splitSize = max(n2,min(n1,n0))
則map的個數為:文件大小/(splitSize*1.1) 的向上取整。






評論(0)


暫無數據
推薦帖子
0條評論
1條評論
0條評論