题目
强化学习的框架是智能体()通过观察当前状态作出相应动作。A. SB. AC. AgentD. Environment
强化学习的框架是智能体()通过观察当前状态作出相应动作。
A. S
B. A
C. Agent
D. Environment
题目解答
答案
C. Agent
解析
强化学习的核心框架由智能体(Agent)和环境(Environment)组成。智能体通过观察当前状态(State),根据策略选择动作(Action)作用于环境,环境则反馈新的状态和奖励。本题的关键在于明确智能体(Agent)是主动执行动作的主体,而非环境或其他概念。
-
概念辨析:
- Agent(智能体):强化学习中的主体,负责根据当前状态选择动作。
- Environment(环境):与智能体交互,提供状态和奖励。
- State(状态):环境当前的信息反馈。
- Action(动作):智能体可执行的操作。
-
逻辑推导:
- 题干中“作出相应动作”的主体应为智能体,而非环境。
- 选项C(Agent)直接对应智能体角色,符合强化学习的基本定义。