17. WEB APPLICATION

構(gòu)建抽象層,然后逐層往下細(xì)化。自頂向下。分優(yōu)先級(jí)。

爬蟲(chóng)應(yīng)用:

接受一個(gè)網(wǎng)頁(yè),PARSE 內(nèi)容,根據(jù)里面的HTML生成新的任務(wù)。

如何去重任務(wù)? 單機(jī)的話,數(shù)據(jù)量小可以用SET,大的話LOCAL set DB去重。多臺(tái)機(jī)器用URL的HASH去做PARTITION。

寫B(tài)FS code for a simple web crawler
multi thread version
to design a more practical system

瓶頸:
網(wǎng)絡(luò)帶寬
計(jì)算資源去PARSE網(wǎng)頁(yè)。

image.png

隊(duì)列SHARDED BY URL。 每個(gè)爬蟲(chóng)只去一個(gè)隊(duì)列取任務(wù)。

常規(guī)PATTERN

1.經(jīng)典方法去分發(fā)JOB給不同WORKER
shard with (hash, range)
batch - group thing together

2.hash table

3.push/pull model

4.handle failure
master/salve
replication

5.cache
write through(寫CACHE,DB在一起,都完成再返回寫完成)
write around (先寫DB,當(dāng)讀CACHE MISS的時(shí)候,LOAD INTO CACHE)
write back

  1. database
    ACID
    sharding

7.knwoledge
network -> disk -> in memory -> l2 cache -> l1 cache
gist.github.com/jboner/2841832/

  1. synchronous/ Asynchronous call
    blog.ometer.com/2011/07/24/callbacks-synchronous-and-asynchronous/

  2. stateful vs stateless
    stateless service is great because can be replicated as many as you want - best scenario for scaliablity - perfect for computational task
    easy to handle client retry

    sharded stateful service is hard to bring up new instance. because you need to redistribute data/ internal states

highscalability.com
aosabook.org/en/distsys.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 書(shū)簽客/書(shū) 選擇一個(gè)適合自己的基金,挺難的。 你要關(guān)注不同類型的基金公司、投資方向、基金經(jīng)理的投資風(fēng)格、投資資產(chǎn)的...
    書(shū)簽客閱讀 619評(píng)論 0 2
  • 喜悅是什么 是一家人游玩時(shí)驚奇的發(fā)現(xiàn) 是心靈相通,接納欣賞 我還是輕易地就把它忘記了 我無(wú)聲的嘆息 又嘆息 是婆婆...
    風(fēng)中Flora閱讀 181評(píng)論 0 4
  • 多一些理解,就會(huì)少一些紛爭(zhēng) 多一些欣賞,就會(huì)少一些冷漠 多一些肯定,就會(huì)少一些指責(zé) 多一些忍耐,就會(huì)少一些焦躁 多...
    與你同走過(guò)閱讀 1,082評(píng)論 0 1
  • 從前我也喜歡小貓小狗,也養(yǎng)過(guò)一只貓、一只狗 那時(shí)候還年少,連自己都不會(huì)照顧的我,更不可能照顧好剛出生沒(méi)多久的小家伙...
    是蓉蓉吶閱讀 285評(píng)論 0 2

友情鏈接更多精彩內(nèi)容