반응형 머신러닝강화학습1 05. 머신러닝 강화 학습 예시 _탁구, 팬케이크, 벽돌깨기 탁구, 팬케이크, 벽돌 깨기 머신러닝 강화학습은 학습에 ‘보상(Reward)’을 이용합니다. 사리사욕이 없는 인공지능을 대상으로 보상을 통해 학습시킨다는 말이 쉽게 이해되지 않을 것입니다. 인공지능에게 제공하는 보상은 사람의 기준과는 차이가 있습니다. 여기서는 인공지능에게 ‘탁구’, ‘팬케이크 뒤집기’, ‘벽돌 깨기’를 학습시키는 사례를 이용해 강화학습에 대해 알아보겠습니다. 머신러닝을 활용하기 전, 탁구를 하는 로봇을 만들기 위해서는 모든 경우의 수에 대한 움직임을 명확하게 프로그램으로 작성해야만 했습니다. ‘공이 어떤 각도에서 어떤 속도로 올 때는 로봇이 어떻게 팔을 움직여 어떤 속도로 공을 치라.’는 식으로 말이죠. 하지만 이를 프로그래밍하는 것은 거의 불가능에 가까웠습니다. 탁구를 하면서 발생할 .. 2022. 7. 14. 이전 1 다음 반응형