问题:
A异步优势动作者·评论者
B行为学派心理学
C深度网络
D确定性策略梯度
E神经情景控制
F决策树
[多选题]选择下列哪些算法(方法)已被发明为专门用于强化学习的算法。
答案解析:
您可能感兴趣的问题
- g = lambda x: 3不是一个合法的赋值表达式。
- 调用函数时传递的实参个数必须与函数形参个数相等才行。
- 15.单项工程造价和单位工程造价有何关系和区别?
- 5.已知浇筑混凝土的基本工作时间为300min,准备与结束时间17.5min,休息时间11.2min,不可避免的中断时间8.8min,损失时间85min,共浇筑混凝土2.5m3。求浇筑混凝土的时间定额
- 8.试述财务基础数据估算表和财务评价报表之间的联系,并详细说明其对应关系。
- 5.对比说明工程概算和工程预算的编制方法。
- 7.试述实物量法和单价法的异同点及其优缺点。
- 17.某承包商面临A,B两项工程投标,因受本单位资源条件限制,只能选择其中一项工程投标,或者两项工程均不投标。根据过去类似工程投标的经验数据,A工程投高标的中标概率为0.3,投低标的中标概率为0.6,
- 19.已知某工程每周拟完工程计划投资、已完工程计划投资和已完工程实际投资,见表8.3。
- 5.竣工验收中的质量核定是由哪个部门组织核定的?在竣工验收中有何意义?