数据存储机制:topic属于逻辑概念,partition属于物理概念,每个partition对应一个log文件,kafka采用分片+索引机制进行存储,每个分区的log分为多个segment存储:.index 偏移量索引文件,.log 日志文件,.timeindex 时间戳索引文件,索引使用稀疏索引:每4kb记录一条索引。segment文件名称:以当前segmeng第一条消息的offset作为文件名称。这些segment文件存储在一个文件夹下:topic名称+分区序号。