College of Computer and Information Science - cs6140 lec11 · 2017-04-06 · Today’s Outline •...

transcript

4/6/17

CS6140:MachineLearningSpring2017

Instructor:LuWangCollegeofComputerandInformaAonScience

NortheasternUniversityWebpage:www.ccs.neu.edu/home/luwang

Email:luwang@ccs.neu.edu

LogisAcs•  GradesforA2isout.

•  Nextweek:courseprojectpresentaAon.

•  Thefinalreportisdueon4/24.Allassignmentshavetobeinby4/29.

•  4/20:finalexam

•  AddiAonalofficehours:–  4.17,4-5pm,(Lu,448WVH)–  4.18,11am-12pm,(TA,166WVH)–  4.19,4-5pm,(Lu,448WVH)

WhatwelearnedlastAme

•  IntroducAontoReinforcementLearning•  TheReinforcementLearningProblem•  MarkovDecisionProcess

4/6/17

Today’sOutline

•  PlanningbyDynamicProgramming– PolicyevaluaAonandpolicyimprovement– ValueiteraAon

[SlidestakenfromDavidSilver’sreinforcementlearningcourse]

4/6/17

Documents