什么是 Multiagent Q Learning---杨熹

瞎采新闻发布于 2020-04-09 评论() 阅读()

multiagent 是指同时有多个 agent 更新 value 和 Q 函数，主要的算法有：q learning， friend and foe q leaning，correlated q learning，在每个训练步骤，学习器会考虑多个 agent 的联合 states，actions，reward，来更新 q 值，其中会用到函数 f 选择价值函数。

下图是单一 agent 和多个 agent 的对比图，可以很直观地看到区别：

---来自腾讯云社区的---杨熹

标签: 什么是 Multiagent Q Learning

点赞( ())

关于作者: 瞎采新闻

这里可以显示个人介绍！这里可以显示个人介绍！

留言与评论（共有 0 条评论）

给这篇文章的作者打赏

关于作者: 瞎采新闻

相关文章

热门文章

1渗透利器 | 常见的WebShell管理工具---Bypass

2什么时候使用 useMemo 和 useCallback---Nealyang

3美国新冠病毒确诊人数统计及预测---用户5908113

4LeetCode 315. Count of Smaller Numbers After Self(线段树，树状数组)---ShenduCC

51小时搞懂 Git 版本控制---CSDN技术头条