多智能体路径规划与强化学习术语整理
整理自日常学习笔记,覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度,再到多智能体强化学习优化的完整技术路线。
Read Full Post ->Content Center
这里记录医院院内物流机器人、多智能体协同调度、MARL、任务分配和协作优化方向的研究笔记。重点不是堆资料,而是沉淀问题建模、技术路线和阶段性结论。
整理自日常学习笔记,覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度,再到多智能体强化学习优化的完整技术路线。
Read Full Post ->强化学习课程笔记原文整理,覆盖基础概念、MDP 与价值函数、动态规划与蒙特卡罗、TD/Sarsa/Q-Learning、函数近似、DQN 与策略梯度。
Read Full Post ->