如何在网络同步中预测角色移动 - 问题详情 - 创脉思

解读

国内 Unity 项目面试里，这道题常被用来区分“只会调用 API”与“真正做过实时网络同步”的候选人。
面试官想听的是：在 50～200 ms 抖动延迟、10% 丢包、移动平台帧率不稳的真实网络下，你怎样让本地角色“立刻”响应玩家输入，同时保证最终位置与服务器一致，且不出现肉眼可见的回滚。
回答必须围绕“客户端预测 + 服务器权威 + 平滑纠正”展开，并给出可落地的 Unity 实现细节。

知识点

客户端预测（Client Prediction）
本地立即执行移动逻辑，不等待服务器回包；用与服务器完全相同的移动代码（Deterministic Movement）计算临时位置。
服务器权威（Server Authority）
服务器以固定帧率（如 20 Hz）运行同一套移动逻辑，产生“真值”并广播。
输入缓存与回滚（Input Buffer & Rollback）
本地为每一帧生成“输入命令”（Cmd），带单调递增的 FrameId；若服务器返回的位置与预测不符，将历史状态回滚到错误帧，再用 faster-than-realtime 重跑后续命令。
位置插值与平滑（Smooth Correction）
不回滚时，采用“收敛因子 + 视觉模型与物理模型分离”策略：
- 物理模型（真实坐标）瞬间纠正；
- 视觉模型（GameObject 显示层）通过 Unity 的 Vector3.SmoothDamp 或自定义 Hermite 插值，在 100～200 ms 内追上物理模型，消除抖动。
丢包与乱序处理
使用冗余输入（Input Redundancy）：每次发包携带最近 3～5 帧 Cmd；服务器用 FrameId 去重并补全缺失输入。
移动端性能优化
- 预测逻辑放在 Unity JobSystem 或 Burst 编译的 C# 代码，保证主线程 < 2 ms；
- 网络层使用 LiteNetLib 或自研 UDP，支持移动网络切换时快速重连 + 会话复用；
- 热更新框架（HybridCLR/ILRuntime）下，预测代码必须放在 AOT 层，避免解释执行带来的抖动。

答案

“我们在《XXX》项目中把角色移动拆成三层：
① 输入层：每帧收集 Horizontal/Vertical、Jump、SkillFlag，封装成 InputCmd，写入环形缓冲区，并立即在本地执行移动逻辑（CharacterController.Move）。
② 预测层：本地维护一个影子世界（Shadow World），用与服务器相同的固定时间步（dt=50 ms）运行；当服务器返回 SyncPacket（含 FrameId、Position、Velocity、State）时，比较本地影子状态：

若误差 < 0.05 m，忽略；
若误差 ≥ 0.05 m，记录偏差 Δ，将影子世界回滚到该 FrameId，重跑后续缓存的 InputCmd，再把重跑后的位置作为新的本地真值。
③ 表现层：摄像机跟随的视觉模型不直接等于真值，而是用收敛速度 = 1 - exp(-dt * k) 做平滑，k 根据 RTT 动态调整（50 ms 延迟 k=15，200 ms 延迟 k=8），保证手感与视觉兼顾。
整个流程在 Unity 的 FixedUpdate 中完成，网络线程通过 ConcurrentQueue 与主线程交换数据，零 GC.Alloc；iPhone 8 上 20 人同屏，预测+纠正耗时 < 1.5 ms。”

拓展思考

如何在不回滚的情况下做“预测型插值”？
对于轻度竞技或 co-op 游戏，可放弃回滚，改用“服务器时间轴 + 客户端插值（STS）”：本地维护服务器时间 T，渲染时把角色插值到 T-RTT/2 的历史状态，误差用加速度补偿，完全无回滚，但需接受 100 ms 的输入延迟。
Unity 物理引擎非确定，怎么保证预测一致？
放弃 Rigidbody，使用自定义确定性积分（Explicit Euler 或 Verlet），并把浮点误差统一到 netFixedDeltaTime=0.05 s；对地形碰撞改用 BVH + 定点数（FixedPoint.Floor），确保 Android ARM 与 Intel 服务器结果逐位一致。
WebGL 端无法 UDP，延迟 300 ms 以上怎么办？
引入神经网络压缩输入（仅发送 4 维向量 + 3 个按钮位），并在服务器端做输入外推（Input Extrapolation）：用最近 5 帧输入训练 1 层 LSTM，预测下一帧输入，降低有效延迟 20～30 ms；同时本地镜头加动态 DeadZone，让玩家对轻微偏移不敏感。