[AI 프로젝트 코딩기술서] 웹게임 강화학습(Slither.io)

IoT, 인공지능, 빅데이터의 상호관계 및 실무지식을 심화학습하고 산업과 사회에서 겪는 소프트웨어 문제를 코딩을 통해 해결하여 기술적 이슈와 응용능력 배양

 
김민재.png

콘텐츠 소개(About Contents)

본 프로젝트에서는 OpenAI 의 Gym, Universe와 같은 외부 라이브러리의 도움을 받지 않고, 직접 웹게임(Slither.io)를 위한 학습 환경을 제작하고, 이를 통해 실제 강화학습 모델을 학습 해  보았다.  학습  알고리즘으로는,  On-Policy  기반의  Policy  Gradient  방법론을  사용하였으 며, 학습 결과 Random Policy에 비해 뛰어난 모델을 학습해낼 수 있었고, 실제 플레이상에 서도 이를 확인해 볼 수 있었다.

Institution 글로벌공학교육센터(Global Education Center for Engineers)
Subject IoT·인공지능·빅데이터

기획자(Planner)

서울대학교 공과대학 전기정보공학부 
 김민재

첨부파일