无服务器实例是否支持 HA?

解读

面试官抛出“无服务器实例是否支持 HA?”并不是单纯想听你背“支持/不支持”,而是考察三层能力:

  1. Cloud SQL 实例形态 的精准区分——国内候选者常把“Serverless”与“高可用”两个概念混为一谈;
  2. Google Cloud 在国内可用区(北京/上海/香港) 的实际落地限制是否了解;
  3. 能否把技术限制翻译成业务语言,给出可落地的替代方案。
    因此,回答时要先澄清“无服务器实例”在 Cloud SQL 产品线里对应的是 Cloud SQL Enterprise Plus 版本的 Serverless 形态(含 Auto-scaling 与 按需计费),再给出 HA 支持度、限制点、替代架构 三段式结论,才能体现“资深”。

知识点

  1. Cloud SQL 高可用架构:采用跨区域(Regional)双实例(Primary + Standby)+ 同步复制 + 自动切换,RPO≈0、RTO<30s。
  2. Serverless 形态限制:当前仅能在 单可用区(Zonal) 运行,无法挂载跨区域 Persistent Disk,因此 原生 Regional HA 不可开启
  3. 国内合规区差异:北京/上海由合作伙伴运营,控制台里“创建 Serverless”选项默认隐藏,需工单提白名单;香港区可直接体验。
  4. 只读副本(Read Replica) 可跨区部署,但属于 异步复制,不满足 HA 级一致性。
  5. 替代方案
    • 业务层接受 1~2 min 中断:用 Serverless + 定时磁盘快照 + 跨区只读副本,故障时手动 promote。
    • 业务层要求 零数据丢失:直接选用 Enterprise Plus 非 Serverless 形态并开启 Regional HA,放弃按需计费。
    • 预算敏感且读多写少:用 AlloyDB Omni 自建 Kubernetes Operator,在国内裸金属机房实现 Serverless 感知的 Regional HA(需自己运维,面试时提到即可体现深度)。

答案

“Cloud SQL 的 Serverless 实例目前 仅支持单可用区部署,因此 原生 Regional 高可用(HA)无法开启。如果业务对零数据丢失和分钟级切换有硬性要求,建议改用 Enterprise Plus 的常规实例并勾选 Regional 高可用;若业务可接受分钟级中断且希望保留按需计费,可用 Serverless + 跨区只读副本 + 定时快照 做低成本容灾,故障时手动 promote 副本。在国内北京/上海区,Serverless 还需先提交工单加白名单,香港区可直接使用。”

拓展思考

  1. 如果面试官追问“未来 Serverless 会不会支持 Regional HA?”——可答:Google 已在美国多区测试 Serverless for Regional Disk 的 private preview,国内预计 2025 Q2 之后 跟随香港区先行落地,但合规区仍需等合作伙伴升级存储后端。
  2. 进一步展示架构深度:把话题引到 AlloyDB for PostgreSQL——它的 Serverless 形态已内置 Regional HA + 列存加速,国内客户可通过 香港区 + CEN 跨域专线 实现低延迟灾备,既满足合规数据不出境,又获得真正 Serverless 级 HA。