RL : AI KOREA 2019

AIKOREA 2019

알기 쉬운 강화 학습 (1), 강의자 : 성균관대학교 이종욱 교수

강화학습

=> 어떻게 좋은 결정을 내릴지 학습하는 과정

State : 연속적인 상황
Reward : 상대적인 반응 (좋은 거 나쁜거는 한 스텝으로는 알 수 없음)
Action : Reward를 잘 얻기 위해 주체적으로 하는 행동
Agent : state마다 action을 수행해 reward 값을 얻어오는 것

기본 용어

MDP


알기 쉬운 강화학습 (2), 강의자 : 성균관대학교 김유성 교수

1. Dynamic Programming

2. Model-Free Reinforcement Learning


알기 쉬운 강화학습 (3), 강의자 : 성균관대학교 김유성 교수