一、需求
1、對(duì)于所有任務(wù)產(chǎn)生的實(shí)時(shí)數(shù)據(jù),通過Kafka及時(shí)推送。
2、對(duì)于新加任務(wù)需要去歷史全量數(shù)據(jù)表中獲取該任務(wù)已有的歷史數(shù)據(jù)。
3、爬蟲集群在生產(chǎn)數(shù)據(jù)時(shí)需要去全量數(shù)據(jù)中進(jìn)行下匹配,如果不存在才會(huì)推送給Kafka。
二、架構(gòu)設(shè)計(jì)圖

Kafka+MySQL架構(gòu)設(shè)計(jì)
三、結(jié)語(yǔ)
歡迎相關(guān)人員一起交流。