Content Center

项目研究

这里记录医院院内物流机器人、多智能体协同调度、MARL、任务分配和协作优化方向的研究笔记。重点不是堆资料，而是沉淀问题建模、技术路线和阶段性结论。

2026年5月30日

多智能体路径规划与强化学习术语整理

整理自日常学习笔记，覆盖 MAPF、CBS、A*、D* Lite、MARL、MDP、DQN、PPO、CTDE、GNN 等多智能体路径规划与强化学习核心概念。从单机路径规划到多机器人协同调度，再到多智能体强化学习优化的完整技术路线。

2026年5月22日

强化学习课程笔记原文整理，覆盖基础概念、MDP 与价值函数、动态规划与蒙特卡罗、TD/Sarsa/Q-Learning、函数近似、DQN 与策略梯度。