强化学习

题库介绍
强化学习是一种让智能体在与环境交互中通过“试错—奖励”机制自主优化策略的机器学习范式,核心要素包括状态、动作、奖励、策略与价值函数;其目标不是最小化一次性误差,而是最大化长期累积回报,常用算法有Q-Learning、Policy Gradient、Actor-Critic及深度强化学习(DQN、PPO、SAC等),已广泛应用于游戏AI、自动驾驶、推荐系统、量化交易与工业控制等领域。
基本信息
题目数
300
更新时间
2025-10-02

问题目录