1.topic分成多個(gè)partition的話,多個(gè)partition可以分布在多臺機(jī)器上,為topic提供了無限大的橫向拓展性
2. partiton分為多個(gè)segment的話,因?yàn)閟eqment的內(nèi)容是一個(gè)數(shù)據(jù)文件加上一個(gè)索引文件,如果不分成多個(gè)segment,只有一個(gè)partition文件的話,partition會一直變大,對于已經(jīng)過期的數(shù)據(jù)想做刪除,會很麻煩。如果劃分成segment的話,可以刪除已經(jīng)過期的整個(gè)segment文件
3. partition是文件夾,segment是里面的文件
我也是初學(xué)者,寫這個(gè)只是做一下筆記
kafka高吞吐量的原因kafa 吞吐量高的原因 順序讀寫 kafka的消息是不斷追加到文件中的,這個(gè)特性使kafka可以充分利用磁盤的順序讀寫性能 順序讀寫不需要硬盤磁頭的尋道時(shí)間,只需很少的扇區(qū)...