答案及解析：[判断题]强化学习用于提高策略网络（Policy Network）的效果时，需要将输赢作为奖励和惩罚。（）。 - 工学类题库- 答案窝(daanwo.com)-大学作业答案分享平台

投稿 | 充值 | 收藏

热搜： 形势与政策新冠肺炎英语清华大学军事理论大数据重庆大学实验室安全

手机扫码访问

您当前的位置：首页 > 高教类 > 工学类

问题：

[判断题]强化学习用于提高策略网络（Policy Network）的效果时，需要将输赢作为奖励和惩罚。（）。

Tags：学堂在线北京理工大学人工智能（2021秋）习题答案

答案解析：

您可能感兴趣的问题

相关问题

关于我们 | 用户指南 | 版权声明 | 给我留言 | 联系我们 | 积分商城 | 答案求助 | 网站地图

Copyright © 2020 www.daanwo.com All Rights Reserved

沪ICP备19038360号-2