解释“checkpoint”滑动窗口机制如何防止重复传输已同步文档？ - 问题详情 - 创脉思 | 专业面试题库网站

解释“checkpoint”滑动窗口机制如何防止重复传输已同步文档？

解读

在国内 CouchDB 面试中，这道题考察的是你对多主复制协议的深层理解，尤其是增量同步与容错恢复环节。面试官想确认你是否知道：

节点之间如何只传差异数据而不重传整库；
当网络闪断或进程重启后，如何快速续传；
滑动窗口如何平衡内存占用与传输效率。
答出“seq 区间 + 摘要对比 + 窗口滑动”三板斧，即可拿到高分。

知识点

seq_index（更新序列号）：每个数据库实例维护一个单调递增的 seq 计数器，文档每次变更即产生新 seq。
checkpoint 文档：同步结束后，目标节点会在本地 _local/{sourceUUID} 文档里记录最后连续确认的 seq 与摘要哈希，作为下一次同步的“起点”。
滑动窗口：源节点把 seq 区间拆成可配置大小（默认 100）的批次，逐批推送；每成功一批，窗口向前滑动，释放内存。
摘要对比：窗口内若检测到目标节点已拥有某文档（通过 rev 树与哈希比对），则跳过传输，仅更新 seq 指针，实现去重。
容错续传：网络中断后，源节点读取目标节点的 checkpoint，从断点 seq 继续拉取，避免全量重扫。

答案

CouchDB 的 checkpoint 滑动窗口机制通过“seq 区间 + 批次确认 + 摘要去重”三步防止重复传输：

启动同步时，源节点先读取目标节点_local 空间下的 checkpoint 文档，拿到上次成功同步的最大 seq；
以该 seq 为起点，把待同步的变更按**窗口大小（默认 100）**划分批次，逐批发送；
每批到达后，目标节点用rev 树与摘要哈希快速判断文档是否已存在：若存在则仅回写确认 seq，不落地数据；
当一批全部确认，窗口向前滑动，源节点更新本地内存指针，并异步写回新的 checkpoint；
若中途掉线，重启后双方再次读取最新 checkpoint，即可从断点续传，既节省带宽，又保证 exactly-once 语义。

拓展思考

窗口大小调优：国内公有网 2 Mbps 小水管场景，可把 window 降到 20，减少超时；内网万兆环境可放大到 1000，提升吞吐。
冲突积压风险：若业务热点 key 频繁冲突，rev 树会膨胀，导致摘要对比 CPU 飙高，可配合_revs_limit 参数裁剪历史。
多源并发：同一目标被 A、B 两源同时写入时，checkpoint 文档以源节点 UUID 为键隔离，互不覆盖，实现多路并行续传。
监控指标：建议把checkpoint 滞后 seq 数与滑动窗口重试次数接入 Prometheus，提前发现“假死”同步链路，避免国内客户业务高峰期的跨省跨云同步雪崩。

题目导航

上一题：当移动端网络从 5G 降级到 2G 时，如何动态调整“batch_size”与“batches_limit”？下一题：PouchDB 的“rev_tree”与 CouchDB 的“rev”格式有何异同？