请在 下方输入 要搜索的题目:

强化学习用于提高策略网络(Policy Network)的效果时,需要将输赢作为奖励和惩罚。()。A.正确B.错误

强化学习用于提高策略网络(Policy Network)的效果时,需要将输赢作为奖励和惩罚。()。
A、正确
B、错误

发布时间:2024-12-23 18:33:02
推荐参考答案 ( 由 快搜搜题库 官方老师解答 )
联系客服
答案:A
专业技术学习
专业技术学习
搜搜题库系统