下列关于探索与利用的说法中,不正确的是
A、
在多臂赌博机问题中,过度探索会导致算法很少主动去选择比较好的摇臂
B、
在多臂赌博机问题中,过度利用可能导致算法对部分臂膀额奖励期望估计不准确
C、
在c贪心算法中,c的值越大,表示算法越倾向于探索
D、
在多臂赌博机问题中,某时刻UCB1算法上界为R,则此时任意摇动一个臂膀,得到的硬币数量不会超过R
发布时间:2025-06-20 13:59:42
A、
在多臂赌博机问题中,过度探索会导致算法很少主动去选择比较好的摇臂
在多臂赌博机问题中,过度利用可能导致算法对部分臂膀额奖励期望估计不准确
在c贪心算法中,c的值越大,表示算法越倾向于探索
在多臂赌博机问题中,某时刻UCB1算法上界为R,则此时任意摇动一个臂膀,得到的硬币数量不会超过R