请在下方输入要搜索的题目：

下面哪一种方法不是通过迭代计算贝尔曼方程来进行策略评估（）

A、动态规划;
B、蒙特卡洛采样;
C、时序差分（Temporal Difference）;
D、深度学习

发布时间：2025-05-20 09:03:11

推荐参考答案 ( 由快搜搜题库官方老师解答 )

联系客服

答案：深度学习

专业技术学习

相关试题

专业技术学习

搜搜题库系统

公务员法题库中公教育题库事业考试题库南方电网考试题库社区工作者考试题库考研历年真题库银行从业题库建行考试题库管理知识题库教师资格证题库后备干部考试题库中国移动笔试题库国网题库考研数学题库公务员题库app 国家电网考试题库大学生题库滴滴考试题库答案证券市场基本法律法规题库河北题库