過濾器
如何在100 億URL中判斷某個URL是否存在
1. 布隆過濾器
使用:布隆過濾器??梢杂糜跈z索一個元素是否在一個集合中。它的優(yōu)點是空間效率和查詢時間都遠(yuǎn)遠(yuǎn)超過一般的算法,缺點是有一定的誤識別率和刪除困難
效果:文章提到:如果將 100 億 url(64bit) 放到 HashMap 中需要 640GB,那么使用布隆過濾器后又需要多少空間呢?答案是約等于 23 GB
2. 布谷過濾器-cuckoo filter
優(yōu)化:布隆過濾器只支持新增、查找,布谷過濾器支持刪除