構(gòu)建抽象層,然后逐層往下細(xì)化。自頂向下。分優(yōu)先級(jí)。 爬蟲應(yīng)用: 接受一個(gè)網(wǎng)頁,PARSE 內(nèi)容,根據(jù)里面的HTML生成新的任務(wù)。 如何去重任務(wù)?...
數(shù)據(jù)處理 背景 最經(jīng)典的一個(gè)數(shù)據(jù)處理MODEL 問題:每次處理一個(gè)請(qǐng)求,大量請(qǐng)求來的時(shí)候不是很高效。 解決方案,批處理。 批處理的時(shí)候,可以批量...
1.背景REAL TIMELatency lowdata in motion延時(shí)性要求高,系統(tǒng)快速收集數(shù)據(jù)快速處理。 所以需要消息系統(tǒng),你不能都...
當(dāng)計(jì)算應(yīng)用在一個(gè)很大的數(shù)據(jù)集上。會(huì)有哪些挑戰(zhàn)? 內(nèi)存存不下 速度上不去上面2個(gè)問題就是并行算法需要解決的。 BATCH VS STREAMSTR...
原則:在title 底下,要弄清有哪些實(shí)際功能。針對(duì)功能分析INPUT, OUTPUT;(USE CASE -> Functionality -...
分布式系統(tǒng)主要有5個(gè)點(diǎn)可擴(kuò)展性,可用性,可靠性,效率,可維護(hù)性。 可擴(kuò)展性 可擴(kuò)展性是系統(tǒng),流程或網(wǎng)絡(luò)增長(zhǎng)和管理增長(zhǎng)需求的能力。任何可以不斷發(fā)展...
長(zhǎng)輪訓(xùn),WEB SOCKET 和 SEVER-SENT EVENT的區(qū)別? 長(zhǎng)輪詢,WebSockets和服務(wù)器發(fā)送事件是Web瀏覽器和Web服...
CAP定理指出,分布式軟件系統(tǒng)不可能同時(shí)提供以下三種保證(CAP)中的兩種以上:一致性,可用性和分區(qū)容錯(cuò)性。當(dāng)我們?cè)O(shè)計(jì)一個(gè)分布式系統(tǒng)時(shí),在CAP...
在數(shù)據(jù)庫領(lǐng)域,有兩種主要類型的解決方案:SQL和NoSQL - 或關(guān)系數(shù)據(jù)庫和非關(guān)系數(shù)據(jù)庫。 它們的構(gòu)建方式,存儲(chǔ)的信息類型以及存儲(chǔ)方式各不相同...