본문 바로가기
청소년/<청소년을 위한 이것이 인공지능이다>

05. 떼려야 뗄 수 없는 빅데이터와 인공지능

by BOOKCAST 2022. 9. 23.
반응형

 


 


스튜어트 러셀의 《인공지능 현대적 접근방식》에 따르면, 인공지능은 철학, 수학, 경제학, 신경과학, 심리학, 컴퓨터 공학, 제어 이론, 인공두뇌학, 언어학에 기반하고, 기술적 관점으로는 대략 검색, 제약 만족 문제, 논리적 에이전트, 계획 수립, 지식 기반 시스템, 확률적 추론, 의사결정, 머신러닝, 자연어 처리로 분류됩니다. 이처럼 인공지능은 매우 범위가 넓은 학문입니다. 만약 어떤 사람이 “나는 인공지능 전문가입니다”라고 한다면, 이 사람은 인공지능에 대한 이해의 수준이 피상적이고 개론적인 사람일 것입니다.

인공지능의 양대 축은 ‘전문가 시스템’과 ‘머신러닝(Machine Learning, 기계 학습)’입니다. 전문가 시스템은 백지상태의 에이전트에 전문가들의 지식 체계에 따라 정리한 데이터를 넣어 훈련시키는 시스템을 말합니다. 1997년 체스 세계 챔피언 카스파로프를 격파한 슈퍼컴퓨터 딥블루와 2011년 미국의 최장수 퀴즈쇼 ‘제퍼디’에서 우승한 IBM의 인공지능 왓슨이 대표적인 전문가 시스템입니다. 그리고 머신러닝은 선별하지 않은 모든 데이터를 마치 달리는 증기기관차에 계속 석탄을 주입하듯이 에이전트에 입력해 학습시키는 시스템을 말합니다.

최근에는 인공지능 기술 중 ‘딥러닝(Deep Learning)’이 각광받고 있습니다. 사실 머신러닝의 기법에는 의사결정나무(decision tree), 랜덤 포레스트(random forest), 베이즈 분류 모형, 서포트 벡터 머신, 유전자 알고리즘, 사례 기반 추론, 패턴 인식, 강화 학습 등 100가지가 넘는 기법이 있습니다. 그리고 딥러닝은 이들 중 ‘인공신경회로망(Neural network)’이 최근 이름을 달리한 것입니다.

인공신경회로망은 1990~2000년대 초반에, 세상의 모든 난제를 풀 수 있을 것으로 기대받던 기법입니다. 저도 1999년부터 4년간 인공신경회로망으로 핵융합 장치 안에 있는 플라즈마의 위치를 파악하고 제어하기 위한 연구를 했습니다. 핵융합이 실현되려면 헬륨 온도를 수억 도 이상으로 끌어올려야 하는데, 물질 온도가 이렇게 높아지면 물질이 기체 상태를 넘어 플라즈마 상태가 되어 버립니다. 그리고 플라즈마 상태에서는 분자와 전자가 기체 상태일 때보다 자유롭고 복잡하게 돌아다니게 되어 이를 제어할 수 없습니다. 저는 전기공학과 제어공학만으로는 풀 수 없는 이 문제를 인공신경회로망으로 해결하고 싶었습니다. 그러나 결과적으로는 실패하고 말았습니다.

그러다가 컴퓨터의 성능이 향상되고 빅데이터 시대가 본격화되면서 인공신경회로망의 침체기가 끝납니다. 인공신경회로망의 기술적 문제도 많은 시행착오 끝에 해소되었는데, 특히 은닉층(hidden layer)이 3개 이상이면 예측 정확도가 급격히 떨어지는 ‘기울기 소멸 문제(vanishing gradient problem)’가 아래의 시도들이 끊임없이 누적되어 해결되었습니다.

빅데이터와 인공지능은 사다리의 양쪽 다리와 같아서 한쪽만 발달해서는 제대로 된 성과를 낼 수 없습니다. 빅데이터를 훈련 데이터로 삼아서 인공지능을 훈련시켜야만 인공지능이 제대로 성능을 보여줄 수 있고, 빅데이터로부터 의미 있는 메시지를 얻을 수 있습니다. 인공지능이 거대한 상어라면, 빅데이터는 풍요로운 바닷물과 같습니다. 바닷물인 빅데이터가 제대로 준비되지 않아 그간 인공지능이 사막에 떨어진 상어와 같은 처지에 있던 것이죠. 그나마 최근 한강 정도의 크기의 빅데이터 생태계가 만들어지면서 인공지능이 성과를 보여준 거로 이해하면 좋습니다. 빅데이터 생태계가 태평양처럼 커진다면 인공지능이 보여 줄 수 있는 성과와 영향력 또한 더욱 커질 것입니다.

반응형

댓글