[AI 심화] 강화학습
기계 학습의 한 분야로서 트웨어가 보상(reward)을 극대화하기 위하여 어떤 행동을 취할지를 자동으로 학습
2021 학년도 1학기 공과대학 전공교과목 [강화학습]의 모듈별 동영상 강의 및 실습자료

★ 강화학습은 AlphaGo와 backgammon을 비롯한 최신 AI 응용에 사용

★ markov decision process, planning, prediction, policy gradient, exploration/exploitaion

Quantity총 14차시

Institution글로벌공학교육센터(Global Education Center for Engineers)


서울대학교 공과대학 컴퓨터공학부 
강유 교수
