手机扫码访问

导航
您当前的位置:首页 > 高教类 > 工学类
问题:

[判断题]强化学习用于提高策略网络(Policy Network)的效果时,需要将输赢作为奖励和惩罚。()。
答案解析:

相关问题
关于我们 | 用户指南 | 版权声明 | 给我留言 | 联系我们 | 积分商城 | 答案求助 | 网站地图
Copyright © 2020 www.daanwo.com All Rights Reserved