AI/Reinforcement Learning
-
Chapter 03) Model-based PlanningAI/Reinforcement Learning 2023. 4. 12. 23:14
Chapter 03) Model-based Planning 이 중, 오른편에 속하는 Model Based RL를 공부한다 목차 Dynamic Programming Prediction (evaluation) Iterative Policy Evaluation Control Policy Iteration Value Iteration 내용 Model-based : Model을 알고 있음 (= 즉 transition function을 알고 있다) Planning : 환경에 대한 model를 알고 있고, agent는 외부적인 상호작용을 하지 않은 채 그 model에 대해 계산한다 ⇒ Dynamic Programming! ⇒ state value function을 적용하였을 때보다 action value functi..
-
Chapter 02) Markov Decision ProcessAI/Reinforcement Learning 2023. 4. 12. 22:49
Chapter 02) Markov Decision Process 목차 Markov Property State Transition Matrix Markov Process(=Chain) Markov Reward Process (Discounted) Return Value Function - State Value Function Bellman Equation for MRPs Markov Decision Process Bellman Expectation Equation Policies Value Function Bellman Optimality Equation Optimal Policies Optimal Value Function 내용 1. Markov Property ⇒ " 어떤 상태 S는 Markov 상태이..
-
Chapter 01) Reinforcement Learning OverviewAI/Reinforcement Learning 2023. 4. 11. 19:41
Chapter 01) Reinforcement Learning Overview InstructGPT에도 강화학습이 쓰였다니 ! 앞으로 더 발전할 분야인 듯 하다 예전에 강화학습 수업 들은 적 있었는데, 학점 망했던 기억이... ㅋㅋㅋ큐ㅠ 그래도 공부는 열심히 했으므로 2년 전에 노션에 남겼던 흔적을 올리기로 ~ 목차 Reinforcement Learning이란 ? Reinforcement Learning의 의미 Reinforcement Learning의 특징 4가지 Reinforcement Learning의 구조 Rewards Environments Agents Reinforcement Learning의 Algorithms 용어정리 Exploration VS Exploitation Prediction V..
-
강화학습 프로젝트 참고 자료AI/Reinforcement Learning 2021. 11. 6. 15:58
https://data-newbie.tistory.com/648?category=776421 [RL] 강화학습 알고리즘 baseline 코드 URL github.com/openai/baselines/tree/master/baselines openai/baselines OpenAI Baselines: high-quality implementations of reinforcement learning algorithms - openai/baselines github.com stable-baselines... data-newbie.tistory.com https://www.kaggle.com/osbornep/-reinforcement-learning-from-scratch-in-python Reinforceme..