如何只上传聚合结果而非原始 10 k 文档？ - 问题详情 - 创脉思

解读

面试官真正想确认的是：

分三步落地，既遵守 CouchDB 机制，又满足国内合规与带宽限制：

本地预聚合
在边缘节点（Android、IoT 网关或门店服务器）用 PouchDB/Cloudant-Sync 先读取 10 k 条本地文档，通过 Map/Reduce 或 JavaScript 聚合脚本 算出指标（如销售额、库存总量）。
把聚合结果写成一条新文档：
```
{
  "_id": "agg_20250618_001",
  "type": "daily_sales",
  "amount": 12345.67,
  "count": 10,
  "storeId": "sh001",
  "timestamp": "2025-06-18T14:00:00+08:00"
}
```
隔离上传通道
创建独立数据库 sales_agg，只放聚合文档；原始明细库 sales_raw 标记 "do_not_replicate" 或使用 过滤函数 return false; 禁止上传。
对 sales_agg 开启单向复制到云端，带宽瞬间降到 1/10 k。
云端消费与回写
云端监听 sales_agg 的 _changes，触发后续业务（BI 报表、预警）。
若总部需要下推配置，用 separate config db 反向同步，不触碰原始明细，实现“上行只传结果、下行只传指令”的干净通道。

一句话总结：把聚合动作下沉到本地，把 CouchDB 的“文档”变成“聚合结果”，再让复制只关心这条结果文档。

如果聚合维度动态变化（如突然按小时变按分钟），如何让 聚合代码热更新 而不断网？
可把聚合脚本做成 attachment 存于 _design/agg 文档，利用 CouchDB 自身的同步机制下发新版本，边缘节点定时重载。
当边缘节点算力不足，能否用 云边协同？
国内运营商已推 5G MEC，可把轻量 Flink 任务部署到 MEC 节点，CouchDB 通过 changes feed 把增量推给 MEC，算完再写回 agg 库，既省终端电量又满足低时延。
若集团审计突然要求“回溯原始 10 k 条”，而本地已清理，如何补救？
提前在本地把原始数据 加密打包成 blob，存到 对象存储（OSS、COS），只在 CouchDB 里保留 外链与哈希。审计时走内网拉取，平时不同步，用时可验证，兼顾合规与带宽。