본문 바로가기
컴퓨터·IT/<비전공자를 위한 인공지능 교과서>

02. 인공지능은 어떻게 해서 최고의 한 수를 선택할까요?

by BOOKCAST 2022. 5. 11.
반응형

 

 


 


사람이 넘어지면서 걸음마를 배우는 것처럼, 인공지능도 실수를
해가며 판단 기준을 변화시켜서 최고의 한 수를 선택합니다.

인공지능은 입력된 정보에서 ‘각각의 행동에 대한 효용’을 계산하며, ‘그중에서 효용이 가장 높은 행동을 선택한다’는 점에서 ‘합리적으로 행동하는 시스템’이라고 설명하였습니다. 이 입력을 출력으로 변환하기 위해 인공지능 내부에서 수행하는 연산을 효용 함수(utility function)라고 합니다.

효용 함수는 인간에 비유하면 가치관에 해당합니다. 인간도 현재 상황에서 각각의 선택지가 얼마나 좋은 결과를 가져올지 비교하며, 가치관에 따라 행동을 결정합니다. 효용 함수가 인간의 가치관과 일치한다면, 인공지능은 인간과 똑같은 행동을 선택할 수 있을 것입니다.

<그림 7>
 

 

걸음마를 배우는 아기 인공지능

‘효용 함수’에 대해 조금 더 살펴보겠습니다. 아기를 예로 들면 이해하기 쉽습니다. 아기는 태어나자마자 바로 걷지는 못합니다. 이는 시각과 다리, 세반고리관의 입력에 대응해서 관절을 연속적으로 움직여가며 근육에 힘을 주는 행동을 할 수 없다는 뜻이기도 합니다. 인공지능에 빗대어 표현하면 효용 함수가 구축되어 있지 않기 때문이라고 할 수 있습니다(근력에 관한 논의는 생략합니다).

하지만 조금씩 움직여(학습해) 가는 것에 따라 어떤 행동을 취하면 좋을지 점점 명확해집니다. 바꿔 말하면 외부 입력으로부터 적절한 행동의 효용을 계산할 수 있는 내부적인 가치관(효용 함수)이 구축되었다고 할 수 있습니다.

<그림 8>
 

이렇듯이 ‘인공지능이 학습한다’는 것은 어떤 특정 작업의 ‘입력에 대해 적절한 출력을 하는 가치 판단’을 손에 넣으려는 것입니다. 인공지능 중에서도 머신러닝(기계학습)이라는 분야는 ‘준비된 데이터를 학습하면서 최적의 효용 함수를 얻는 것’입니다. 구체적인 예로 이미지 인식 인공지능을 알아보겠습니다.

이미지 인식 인공지능은 ‘이미지(사진)에 찍힌 것이 무엇인가’를 효용 함수가 계산합니다. 예를 들어, 사과가 찍혀 있으면 사과의 효용 함수 출력 결과가 높은 숫자가 됩니다. 만약 바나나가 찍혀 있지 않으면, 바나나의 효용 함수 출력 결과는 낮은 숫자가 됩니다.

미학습 상태라면 ‘이미지에 포함되어 있는 것이 무엇인가’를 맞추는 행동(의사결정)을 할 때, 사과와 바나나의 효용 함수는 무작위 숫자(무작위 값)를 반환합니다. 자세한 내용은 뒤에서 설명하겠지만 이 효용 함수를 의미 있는 것으로, 그리고 정확한 것으로 만들어가는 것이 인공지능의 학습입니다.

인공지능의 학습은 사람과 마찬가지로 실수로부터 서서히 학습하고, 어떤 일정한 학습을 한 뒤에는 높은 정확도로 효용을 계산할 수 있게 됩니다. <그림 9>는 학습을 반복하는 것으로 정확도가 향상되는 것을 보여 줍니다.

 

<그림 9>
반응형

댓글