LevelDB 源码阅读:布隆过滤器原理、实现、测试与可视化
LevelDB 中数据存储在 SSTable 文件中,当用 Get() 来查询 key 的时候,可能需要从 SST 文件中读取多个块。为了减少磁盘读取,LevelDB 提供了 FilterPolicy 过滤策略,如果判断出来一个 Key 不在当前 SSTable 文件中,那么就可以跳过读取该文件,从而提高查询效率。
LevelDB 支持用户自定义过滤策略,不过提供了一个默认的布隆过滤器实现。布隆过滤器是一种空间效率极高的数据结构,用于判断一个元素是否存在于一个集合中,有一定的误判率但没有漏判。简单说就是如果布隆过滤器判断一个元素不存在,那么这个元素一定不存在;如果布隆过滤器判断一个元素存在,那么这个元素可能不存在。