Human-level Control Through Deep Reinforcement

    Human-level Control Through Deep Reinforcement

    Human-level Control Through Deep Reinforcement

    강화학습 알고리즘을 deep neural network에 연결 SGD 업데이트를 통해 학습 데이터(RGB images)를 효과적으로 process함 이 논문은 강화 학습을 위한 새로운 딥 러닝 모델을 소개하고 raw 픽셀만 input으로 사용하여 Atari 2600 컴퓨터 게임에 대한 어려운 policy control을 마스터하는 능력을 보여줌. 또한 확률적 미니배치 업데이트와 experience replay memory를 결합하여 RL에 대한 deep neural network 학습을 용이하게 하는 Online Q-learning의 변형을 제시함. 논문의 접근 방식은 아키텍처나 하이퍼파라미터를 조정하지 않고 테스트 한 7개 게임 중 6개에서 최첨단 결과를 제공 1. Experience Replay Me..