考试
1970-01-01 08:00:00Q-learning算法中, Q函数是()答案?
题目描述
Qlearning算法中,Q函数是()。
A、状态动作值函数
B、状态函数
C、估值函数
D、奖励函数
正确答案:A
答案解析
A
加载中...
AI正在思考中,请稍候...相关试题
【填空题】 控制坝基及地基的渗流,其主要任务
(多选题)下面哪几种方式可以发现扫描痕迹()
某学者认为:“两宋百二十年中。物质文明和精神
洪仁玕在《资政新篇》中说:“兴银行,倘有百万
教科书是课程资源的重要组成部分,也是课程实施
读图与思考
华夏民族是在哪诞生的?
中国饮食文化的特征有哪些?
据12月8日《参考消息》报道:12月1日出生
《固体废物污染环境防治法》对固体废物污染环境
行车制动装置用脚控制,停车制动装置以手制动。
出口特快专邮件收寄后,发现内装禁寄物品,可作
纳税人假报出口,取得国家出口退税款的行为,属
唐代诗人陆龟蒙有诗曰:九秋风露越窑开,夺得千
团章指出,中国共产党主义青年团是“()。”
开挖深度大于()的基坑为一级基坑。
气预热器是通过()方式进行换热。
按照公司管理规定,低压配电房的保洁工作应安排
铁某,女,妊娠31周,因腹部迅速增大,伴气急
但丁写作《神曲》的时间是:()