99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

<thead id="mro02"></thead>

<center id="mro02"></center>

<pre id="mro02"><fieldset id="mro02"><style id="mro02"></style></fieldset></pre>

熱線電話：13121318867

登錄

291294878

2018-10-23 閱讀量: 1158

reduceBykey與groupByKey哪個性能好？

RDD中reduceBykey與groupByKey哪個性能好，為什么？

reduceByKey：reduceByKey會在結(jié)果發(fā)送至reducer之前會對每個mapper在本地進行merge，有點類似于在MapReduce中的combiner。這樣做的好處在于，在map端進行一次reduce之后，數(shù)據(jù)量會大幅度減小，從而減小傳輸，保證reduce端能夠更快的進行結(jié)果計算。

groupByKey：groupByKey會對每一個RDD中的value值進行聚合形成一個序列(Iterator)，此操作發(fā)生在reduce端，所以勢必會將所有的數(shù)據(jù)通過網(wǎng)絡(luò)進行傳輸，造成不必要的浪費。同時如果數(shù)據(jù)量十分大，可能還會造成OutOfMemoryError。

通過以上對比可以發(fā)現(xiàn)在進行大量數(shù)據(jù)的reduce操作時候建議使用reduceByKey。不僅可以提高速度，還是可以防止使用groupByKey造成的內(nèi)存溢出問題。

0.0000

0

2

關(guān)注作者

收藏

評論(0)

發(fā)表評論

暫無數(shù)據(jù)

CDA考試動態(tài)

考試內(nèi)容

CDA報考指南

聯(lián)系我們

推薦帖子

<ruby id="y1o0b"></ruby>