홈
태그
방명록

분류 전체보기 (257)

ABOUT ME

-

트위터
인스타그램

Today: -

Yesterday: -

Total: -

세상은 내가 정하는 대로 세상은 내가 정하는 대로

컨텐츠 검색 블로그 내 검색

728x90

mdp

강화학습 Chapter 02) Markov Decision Process
AI/Reinforcement Learning 2023. 4. 12. 22:49

강화학습 Chapter 02) Markov Decision Process 목차 Markov Property State Transition MatrixMarkov Process(=Chain) Markov Reward Process (Discounted) ReturnValue Function - State Value FunctionBellman Equation for MRPs Markov Decision Process Bellman Expectation Equation PoliciesValue Function Bellman Optimality Equation Optimal PoliciesOptimal Value Function 내용 1. Markov Property ⇒ " 어떤 상태 S는 Mar..

이전

1

다음

인기포스트

ABOUT ME

LINK

ADMIN

admin 글쓰기

728x90

Designed by Tistory.

티스토리툴바