题目
强化学习的学习依据是什么()A. 基于监督信息B. 基于对数据结构的假设C. 基于评价D. 基于人工反馈
强化学习的学习依据是什么()
A. 基于监督信息
B. 基于对数据结构的假设
C. 基于评价
D. 基于人工反馈
题目解答
答案
C. 基于评价
解析
强化学习是一种机器学习方法,它通过与环境的交互来学习如何采取行动以最大化某种累积奖励。学习依据是基于评价,即通过环境反馈的奖励或惩罚来调整策略,以优化长期累积奖励。
A. 基于监督信息
B. 基于对数据结构的假设
C. 基于评价
D. 基于人工反馈