请在 下方输入 要搜索的题目:

关于A3C算法说法正确的是


A、使用了多个线程,每个线程对应了不同的探索方式;
B、需要使用经验池存储样本;
C、A3C是off-policy的算法;
D、A3C是on-policy的算法

发布时间:2025-06-08 14:28:28
推荐参考答案 ( 由 快搜搜题库 官方老师解答 )
联系客服
答案:使用了多个线程,每个线程对应了不同的探索方式; A3C是on-policy的算法
专业技术学习
专业技术学习
搜搜题库系统