2015 年,因為工作崗位的變動,開始負(fù)責(zé)給集團(tuán)招聘一些技術(shù)人員,出于對公司的負(fù)責(zé),也為了更好的勝任技術(shù)經(jīng)理的職位,在面試的這件事上,我做了大量的“功課”,首先我研究了幾乎所...
構(gòu)建倒排索引的幾個主要步驟: 1 收集待建索引的文檔2 對這些文檔中的文本進(jìn)行詞條化3 對步驟2中的詞條進(jìn)行語言學(xué)預(yù)處理,得到此項4 根據(jù)詞項對所有文檔建立索引 重要概念 詞...
??Google File System(簡稱GFS)是適用于大規(guī)模且可擴展的分布式文件系統(tǒng),可以部署在廉價的商務(wù)服務(wù)器上,在保證系統(tǒng)可靠性和可用 性的同時,大大降低了系統(tǒng)的...
??存儲和訪問數(shù)百PB的數(shù)據(jù)是一個非常大的挑戰(zhàn),開源的RocksDB就是FaceBook開放的一種嵌入式、持久化存儲、KV型且非常適用于fast storage的存儲引擎。?...
Introduction ??很長一段時間,持久化數(shù)據(jù)存儲都是使用磁盤。隨著SSD的引入,我們現(xiàn)在有了新的持久化的存儲介質(zhì),這種存儲介質(zhì)比傳統(tǒng)的磁盤更快,也給人們提供了探索分...
??Simulation Cache(SimCache)可以幫助用戶在模擬的內(nèi)存容量而不是物理上實際占用內(nèi)存下預(yù)測block cache的性能數(shù)據(jù),比如:hit、miss。 ...
RocksDB Iterator ??RocksDB Iterator提供用戶以有序的方式前向或者后向遍歷DB,也可以seek 到DB的特定key上。為了做到這樣,Itera...
??本文主要講解了RocksDB中二階段提交的實現(xiàn)。本文總結(jié)一下共有如下幾個要點: Modification of the WAL format Extension of t...
Overview ??Repairer會在RocksDB出現(xiàn)宕機等嚴(yán)重問題時盡最大努力去恢復(fù)盡可能多的數(shù)據(jù),但是,并不能保證恢復(fù)數(shù)據(jù)庫到一個一致性的狀態(tài)。 Usage ??C...