2021-01-28
閱讀量:
421
如何實現(xiàn)分布式爬蟲
要實現(xiàn)分布式爬蟲,就必須解決以下幾個問題。
共享請求隊列:多個Scrapy共享同一個請求隊列,從同一個隊列中獲取請求,避免分配重復(fù)的請求。
共享指紋集合:多個Scrapy共享同一個指紋集合,實現(xiàn)去重功能。
匯總爬蟲數(shù)據(jù):將多個Scrapy各自爬取下來的數(shù)據(jù)匯總到同一個地方。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論
0條評論