728x90
TRANSITION
-
강화학습 Chapter 03) Model-based PlanningAI/Reinforcement Learning 2023. 4. 12. 23:14
강화학습 Chapter 03) Model-based Planning 이 중, 오른편에 속하는 Model Based RL를 공부한다 목차 Dynamic ProgrammingPrediction (evaluation)Iterative Policy EvaluationControlPolicy IterationValue Iteration 내용 Model-based : Model을 알고 있음 (= 즉 transition function을 알고 있다)Planning : 환경에 대한 model를 알고 있고, agent는 외부적인 상호작용을 하지 않은 채 그 model에 대해 계산한다⇒ Dynamic Programming! ⇒ state value function을 적용하였을 때보다 action val..