본문 바로가기
컴퓨터·IT/<비전공자를 위한 인공지능 교과서>

05. 인공지능이 인공지능을 만든다는 게 무슨 뜻인가요?

by BOOKCAST 2022. 5. 14.
반응형

 


 


인공지능을 만들 때 필요한 과정의 일부를 인공지능에게 맡기는 것을 말합니다. 사람이 만든 인공지능보다 뛰어난 성능을 보여 주는 사례도 있습니다.

최근 엄청난 기세로 주목을 받고 있는 연구 분야가 있습니다. AutoML이란 것으로, 한마디로 말하면 인공지능이 인공지능을 만들도록 하자는 것입니다.


전문성이 요구되는 인공지능 설계

인공지능이 인공지능을 만들다니 어떻게 된 일일까요? 인공지능을 만드는 과정에서 사전에 정해야 하는 두 가지가 있습니다.

1. 인공지능에게 무슨 일을 시키고 싶은지(목적 함수)
2. 인공지능의 아키텍처(알고리즘의 종류)

첫 번째 항목은 당연히 사람이 정의해야 하지만, 두 번째 항목은 자동화를 시도해볼 수 있습니다. 실제로 어떤 하나의 작업을 수행하려면 여러 가지 아키텍처나 알고리즘 가운데 선택해야 하는 경우가 많습니다.

ILSVRC(ImageNet Large Scale Visual Recognition Challenge)라고 하는 이미지 인식 대회에서는 동일한 데이터세트에 대해서 다양한 알고리즘이나 딥러닝 아키텍처가 제안되면서 해마다 정확도가 향상되고 있습니다. 2015년에는 드디어 사람의 벤치마크를 넘어섰습니다.

이로 인해 인공지능의 내부는 자동으로 설정된다고 자칫 착각하기 쉬운데, 무슨 일이 있어도 사람이 설정해야 하는 부분이 존재합니다. 이것을 하이퍼파라미터(hyperparameter)라고 부릅니다. 예를 들어, 딥러닝에서는 층(layer)의 깊이나 뉴런의 수 등이 해당됩니다. 좀 더 비유하자면 인공지능의 설계도 같은 것으로서, 학습하는 방법은 같더라도 이 하이퍼파라미터가 다르면 인공지능의 퍼포먼스도 달라집니다.

이런 하이퍼파라미터는 인공지능이 학습할 수 없는 것으로서, 전문 엔지니어가 성능을 향상시키기 위해 방대한 실험을 통해 얻은 지식, 경험, 감각 등을 기반으로 시행착오를 거듭하면서 찾아내고 있습니다.


인공지능이 만드는 인공지능은 인간이 만드는
것보다 고성능


이러한 전문 인력이 필요한 작업을 기술로 해결할 수 없을까 하는 의문은 오래 전부터 존재했습니다. 그 방안으로 구글은 2018년 AutoML이라는 기술을 발표했습니다. 이름 그대로 머신러닝 과정에서 아키텍처나 하이퍼파라미터의 결정을 위해 시행착오를 반복해야 했던 작업을 자동화하는 도구입니다.

그림 43
 

AutoML의 새로운 점은 두 인공지능을 동시에 학습시킨다는 점입니다. 인공지능의 하이퍼파라미터나 아키텍처를 제안하는 ‘부모 인공지능’과 이 ‘부모 인공지능’에 의해 생성된 기존 방식의 인공지능인 ‘자식 인공지능’이 있습니다. AutoML의 학습 사이클은 다음과 같습니다.


➊ 부모 인공지능이 자식 인공지능을 생성한다.
➋ 자식 인공지능이 데이터세트를 학습한다.
➌ 자식 인공지능의 학습 결과를 부모 인공지능에게 전달한다.
➊ 부모 인공지능은 그 피드백을 바탕으로 새로운 자식 인공지능을 생성한다.
➋ 새로운 자식 인공지능이 그 형태로 학습한다.
:

‘부모 인공지능이 학습하는 시그널’은 ‘자식 인공지능이 보여 주는 정확도’가 됩니다. 부모 인공지능이 제안한 하이퍼파라미터나 아키텍처에 의해 자식 인공지능의 정확도가 높아지거나 낮아지는 사이클을 반복하면서 부모 인공지능은 어떤 구조를 선택해야 정확도가 높아지는지 차츰차츰 학습해 나갑니다.

여기서는 부모 인공지능과 자식 인공지능이라는 두 인공지능이 역할을 분담해서 각각 다른 작업을 풀어 나가고 있음을 알 수 있습니다. 거시적으로 보면 하나의 인공지능이지만, 내부적으로는 두 인공지능이 사회적 관계를 가지고 하나의 목표를 향해 가고 있는 셈입니다.

2019년에 발표된 논문에서 EfficientNet이라고 불리는 이미지 인식 인공지능은 앞서 설명한 것과 같은 구조로 되어 있습니다. 인공지능에 의해 만들어진 고성능 인공지능입니다. 그림 44는 지금까지 사람이 설계한 아키텍처와 EfficientNet의 성능 비교입니다.

그림 44
 


세로축은 정확도이며 가로축은 파라미터 수(적을수록 계산 효율이 좋음)를 나타냅니다.

EfficientNet은 뉴런이나 계층의 크기에 따라 8종류(B0~B7)가 있으며, 그래프상에 각각 선으로 연결되어 있습니다. 이 선은 정확도에서도, 계산 효율에서도 인간이 지금까지 만들어 온 모델보다 상위에 있습니다. 인공지능이 인공지능을 만드는 모델은 정확도와 속도, 둘 다 사람이 지금까지 지식을 총동원해 설계한 것보다 뛰어난 것을 알 수 있습니다.


인공지능의 민주화와 엔지니어에게 요구되는
가치 변화


이 기술은 이미 실용화 단계에 들어섰습니다. 예컨대 구글의 서비스를 이용하기만 하면 우리는 일류 데이터 과학자가 만든 것과 동급의 모델을 얻을 수 있습니다. 이제까지 전문 지식이 있어야 가능했던 각종 튜닝이나 아이디어가 승패를 좌우하는 아키텍처의 선택을 인공지능에게 맡겨야 하는 셈이 된 것입니다. 오늘날 사람이 하는 일의 일부는 인공지능에게 빼앗길 것이라고 알려져 있는데, 숙련된 인공지능 엔지니어가 하던 일조차도 일부는 인공지능으로 대체되고 있는 것입니다.

물론, AutoML이나 EfficientNet 같은 학습 기법도 완벽하다고 할 수는 없습니다. 무엇보다 엄청난 컴퓨팅 자원이 필요하다고 알려져 있습니다. 그런 의미에서 앞으로 인공지능 엔지니어에게 요구되는 것은 데이터 과학자로서의 역량일 것입니다. 이 데이터에서는 이러한 가치가 창출될 수 있고, ◯◯를 알고 싶은 경우는 ×× 데이터가 필요하며, 컴퓨팅 자원이나 예산을 고려할 때 최적의 기법은 무엇인가와 같은 컨설팅에 가까운 능력이 요구될 것입니다.


실전에서 성능을 증명한 AutoML

AutoML의 보급은 앞으로도 계속해서 가속도가 붙을 것입니다.

캐글(Kaggle)이라고 하는 데이터 분석 공모전에서 실력 있는 데이터 과학자들이 경합을 벌이며 다양한 알고리즘을 제안했는데, 그 알고리즘으로 만든 인공지능과 AutoML이 만들어 낸 인공지능으로 정확도를 겨룬 결과가 공개되어 있습니다. AutoML과 전 세계 데이터 과학자들의 정확도 비교 진검 승부라고 할 수 있습니다.

2019년에 열린 KaggleDays 이벤트27에서 8시간 30분에 걸쳐 진행된 공모전을 통해 최대 3명으로 구성된 팀 74개 조와 AutoML 간에 승부를 결정지을 기회가 생겼습니다. 일련의 자동차 부품에 대한 소재의 특성과 테스트 결과 정보가 주어지면, 그것을 바탕으로 제조의 결함을 예측하는 과제였습니다. AutoML은 최종적으로 2위를 차지했으며, AutoML의 정확도는 이미 인간과 동등하거나 그 이상인 것이 확인되었습니다.


블랙박스화를 더욱 촉진시키는 자동화

그러나 부모 인공지능이 자식 인공지능을 생성하는 방식의 구조가 장점만 있는 것은 아닙니다. 인공지능의 블랙박스화를 더욱 가속화시키기 때문입니다. 왜 그런 아키텍처를 선택해야 하는지, 왜 그런 성능을 낼 수 있는지 해석할 수 없습니다. 이것은 어떤 의미에서 해석 가능성을 요구하는 현재의 추세를 역행하는 것이라고 할 수 있습니다. 그만큼 인공지능 내부에서 무슨 일이 일어나고 있는지에 대한 해석 가능성은 점점 낮아지고 있는 것입니다.


이것만은 알아 두세요!

• 인공지능이 학습해야 하는 대상이 무엇인지, 그리고 모델 아키텍처가 어떤 종류인지에 따라 설정이 필요한 파라미터가 있다.
• 모든 파라미터를 테스트하는 것보다 알고리즘으로 자동화해서 추출하는 것이 성능이 높은 경우가 등장하고 있다.
• 그 결과, 기존에 인간이 만든 것보다 뛰어난 성능의 인공지능이 만들어지게 되었다.

반응형

댓글