问题:
[单选题]强化学习中以下纯基于策略的方法(policy-based)方法不包括以下哪个?()
Apolicy gradient
BActor-Ctiric方法
Ctrust region
Devolution
答案解析:
Copyright © 2020 www.daanwo.com All Rights Reserved |