强化学习用于提高策略网络(Policy Network)的效果时,需要将输赢作为奖励和惩罚。()。A.正确B.错误 强化学习用于提高策略网络(Policy Network)的效果时,需要将输赢作为奖励和惩罚。()。A、正确B、错误 管理学试题库及答案 发布时间:2025-02-11 06:41:21