2018-10-20
閱讀量:
960
Executor/Reciever的容錯(cuò)問題解決。
spark streaming可以通過多種方式作為數(shù)據(jù)sources(包括kafka),輸入的數(shù)據(jù)通過executor中的receivers接收,復(fù)制后存儲(chǔ)于spark中(為了faultolerance,默認(rèn)復(fù)制到兩個(gè)spark executors),如果數(shù)據(jù)復(fù)制完成,receivers可以知道,并通知kafka中更新offsets到zookeeper中。這樣當(dāng)receivers在接收數(shù)據(jù)過程中crash掉,不會(huì)有數(shù)據(jù)丟失,receivers沒有復(fù)制的數(shù)據(jù),當(dāng)receiver恢復(fù)后重新接收即可。







評論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評論
1條評論
0條評論
0條評論