2021-01-28
閱讀量:
382
如何實(shí)現(xiàn)分布式爬蟲
要實(shí)現(xiàn)分布式爬蟲,就必須解決以下幾個問題。
共享請求隊(duì)列:多個Scrapy共享同一個請求隊(duì)列,從同一個隊(duì)列中獲取請求,避免分配重復(fù)的請求。
共享指紋集合:多個Scrapy共享同一個指紋集合,實(shí)現(xiàn)去重功能。
匯總爬蟲數(shù)據(jù):將多個Scrapy各自爬取下來的數(shù)據(jù)匯總到同一個地方。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論
0條評論