答案及解析：[多选题]AlphaGo的策略网络（Policy Network）主要表达了一个根据当前棋局状态获得下一个动作的函数，以下哪些学习方法被用来学习该函数？（）。 A监督学习 B强化学习 C非监督学习 D半监督学习

问题： 用能力工程师程师程师程师 --> href="/gaojiao/gongxue/">工学类

[多选题]AlphaGo的策略网络（Policy Network）主要表达了一个根据当前棋局状态获得下一个动作的函数，以下哪些学习方法被用来学习该函数？（）。
A监督学习
B强化学习
C非监督学习
D半监督学习

答案解析：

您可能感兴趣的问题