2018-10-20
閱讀量:
1005
Executor/Reciever的容錯問題解決。
spark streaming可以通過多種方式作為數(shù)據(jù)sources(包括kafka),輸入的數(shù)據(jù)通過executor中的receivers接收,復制后存儲于spark中(為了faultolerance,默認復制到兩個spark executors),如果數(shù)據(jù)復制完成,receivers可以知道,并通知kafka中更新offsets到zookeeper中。這樣當receivers在接收數(shù)據(jù)過程中crash掉,不會有數(shù)據(jù)丟失,receivers沒有復制的數(shù)據(jù),當receiver恢復后重新接收即可。







評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論