[AI 프로젝트 코딩기술서] 웹게임 강화학습(Slither.io) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
조회 수 : 1481 | |||||||||||
콘텐츠 소개(About Contents)본 프로젝트에서는 OpenAI 의 Gym, Universe와 같은 외부 라이브러리의 도움을 받지 않고, 직접 웹게임(Slither.io)를 위한 학습 환경을 제작하고, 이를 통해 실제 강화학습 모델을 학습 해 보았다. 학습 알고리즘으로는, On-Policy 기반의 Policy Gradient 방법론을 사용하였으 며, 학습 결과 Random Policy에 비해 뛰어난 모델을 학습해낼 수 있었고, 실제 플레이상에 서도 이를 확인해 볼 수 있었다.
기획자(Planner)
|