U E D R , A S I H C RSS

머신러닝스터디/2017 (rev. 1.5)

머신러닝스터디/2017

  • CNN, Artistic style
  • Reinforcement learning, game play

Reinforcement Learning


Monte-Carlo Reinforcement Learning


  • 직접적인 경험으로부터 배움
  • Model-free : 직접적인 MDP transition과 보상을 알 필요가 없다
  • 끝난 에피소드로부터 학습한다.
  • episodic MDP 문제만 풀 수 있다.


Temporal-Difference Learning

Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2021-02-07 05:29:27
Processing time 0.0148 sec