ZeroWiki
FrontPage
FindPage
TitleIndex
RecentChanges
UserPreferences
머신러닝스터디/2017 (rev. 1.5)
머신러닝스터디/2017
CNN, Artistic style
Reinforcement learning, game play
[
edit
]
Reinforcement Learning
¶
[
edit
]
Monte-Carlo Reinforcement Learning
¶
직접적인 경험으로부터 배움
Model-free : 직접적인 MDP transition과 보상을 알 필요가 없다
끝난 에피소드로부터 학습한다.
episodic MDP 문제만 풀 수 있다.
[
edit
]
Temporal-Difference Learning
¶
ShowPage
FindPage
DeletePage
LikePages
last modified 2021-02-07 05:29:27
Processing time 0.0204 sec