手机扫码访问

导航
您当前的位置:首页 > 益智类 > 科普教育
问题:

[单选题]Q 函数 Q(s,a)是指在一个给定状态 s下,采取某一个动作 a 之后,后续的各个状态 所能得到的回报的 ()。
A、期望值
B、最大值
C、最小值
D、总和
答案解析:

您可能感兴趣的问题
相关问题
关于我们 | 用户指南 | 版权声明 | 给我留言 | 联系我们 | 积分商城 | 答案求助 | 网站地图
Copyright © 2020 www.daanwo.com All Rights Reserved