请在 下方输入 要搜索的题目:

蒙特卡洛(MC)算法的特征:


A、需要具体的环境、奖励、状态概率分布的模型;

B、需等到一个episode结束才能更新;

C、是无偏估计;

D、可以只估计一部分我们关心的状态或一个子空间

发布时间:2025-07-14 16:18:10
推荐参考答案 ( 由 快搜搜题库 官方老师解答 )
联系客服
答案:需等到一个episode结束才能更新 ■是无偏估计 ■可以只估计一部分我们关心的状态或一个子空间
专业技术学习
专业技术学习
搜搜题库系统