爬蟲架構(gòu)|利用Kafka處理數(shù)據(jù)推送問題(3)架構(gòu)圖

一、需求

1、對(duì)于所有任務(wù)產(chǎn)生的實(shí)時(shí)數(shù)據(jù),通過Kafka及時(shí)推送。
2、對(duì)于新加任務(wù)需要去歷史全量數(shù)據(jù)表中獲取該任務(wù)已有的歷史數(shù)據(jù)。
3、爬蟲集群在生產(chǎn)數(shù)據(jù)時(shí)需要去全量數(shù)據(jù)中進(jìn)行下匹配,如果不存在才會(huì)推送給Kafka。

二、架構(gòu)設(shè)計(jì)圖

Kafka+MySQL架構(gòu)設(shè)計(jì)

三、結(jié)語(yǔ)

歡迎相關(guān)人員一起交流。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容