解释A*与GOAP的启发式区别 - 问题详情 - 创脉思

解读

国内Unity面试中，这道题常被用来快速区分“只会用NavMesh”与“真正做过AI框架”的候选人。
A的启发式（h）是路径规划层面的“距离估计”，而GOAP的启发式（h）是动作规划层面的“世界状态距离估计”。
很多候选人把GOAP简单说成“带动作的A”，结果一追问“状态如何编码、代价如何设计”就露馅；因此回答时必须把“状态空间”与“地图空间”彻底分开，并给出Unity项目中的量化例子。

知识点

搜索空间维度
A*：二维/三维NavMesh网格或体素，节点=坐标。
GOAP：多维状态向量，节点=世界状态（布尔、枚举、浮点）。
启发式函数h(n)
A*：h=欧氏距离或曼哈顿距离，可接受且一致，保证最优。
GOAP：h=从当前状态到目标状态的“最小动作代价估计”，通常用**忽略负效果（delete relaxation）的规划图（Planning Graph）**分层计算，不保证最优但可快速收敛。
边权重含义
A*：边=移动代价（米或时间）。
GOAP：边=动作代价（CPU时间、动画时长、资源消耗、玩家感知难度等），可在Unity里用ScriptableObject配表动态调。
剪枝与启发式更新
A*：用open/close表+堆即可。
GOAP：需状态哈希+惰性重评估；当动作效果有持续条件（over time effect）时，h值要在每帧TimeSlicing里增量更新，否则移动端会卡顿。
国内项目实战差异
在MOBA或开放世界手游中，A*的h直接调Unity.NavMeshQuery.GetDistanceToGoal()，耗时<0.1 ms；
GOAP的h需离线生成Domain Transition Graph，运行时查表，内存占用<2 MB，否则低端安卓会OOM。

答案

A的启发式函数h(n)是坐标空间中的几何距离，用于估算“从当前格子到终点的最短移动代价”，常用欧氏距离或切比雪夫距离，满足可接受性从而保证路径最优；
GOAP的启发式函数h(s)是世界状态空间中的“动作缺失代价”，通过忽略动作负效果的规划图分层算法快速估算“从当前状态到目标状态还需多少动作代价”，不保证最优但极大剪枝，其数值单位是动作代价点数而非米。
**核心区别：A在几何空间搜索，h=距离；GOAP在状态空间搜索，h=松弛后的动作代价估计。**

拓展思考

Unity项目落地：
在战斗AI中，把GOAP的h值与行为树权重混合，用h+noise做随机化多样性，同时把A*路径代价作为GOAP动作的前提cost，实现“边走边规划”的分层AI，在骁龙660机型上0.8 ms完成20步前瞻。
热更新兼容：
GOAP的Domain文件打成ScriptableObject放Addressables，策划可热更调动作代价；而A*的NavMesh数据需离线烘焙，因此h函数不变，但GOAP的h可热更，这是国内SLG赛季更新常用手段。
面试加分话术：
“我在XX项目中把GOAP的h函数改成神经网络预测，用玩家实时胜率作为额外代价，AI响应时间从1.2 ms降到0.3 ms，同时留存提升3%。”——量化结果+业务价值，可瞬间拉开与其他候选人的差距。