본문 바로가기
컴퓨터·IT/<비전공자를 위한 인공지능 교과서>

06. 인공지능 연구의 최신 동향을 알고 싶으면 어떻게 해야 하나요?

by BOOKCAST 2022. 5. 16.
반응형

 


 


학술지를 구독하거나 학회에 참가하는 방법과 더불어 arXiv라고 하는 출판 전 논문(프리프린트preprint) 수집 사이트 활용을 추천합니다. 다만 정보의 품질에 대해서는 주의해야 합니다.

기업이나 대학 등에서 진행되고 있는 인공지능 연구에 대해 알고 싶으면 어떻게 해야 좋을까요?
현재 세계 각국의 인공지능 연구자가 최신 연구 성과를 발표하는 장소(정보의 1차 소스)는 크게 세 가지가 있습니다(여기서는 구글이나 마이크로소프트 등의 기업이 자체적으로 발표하는 경우는 제외합니다).
• 학술지
• 학회
• arXiv


품질이 보장된 논문을 접할 수 있는 방법

과학자나 연구자가 쓰는 논문은 이제까지는 통상 학술지에 투고되어 왔습니다. 《네이처(Nature)》나 《사이언스(Science)》는 귄위 있는 종합 학술지로 유명합니다. 해당 잡지 편집자는 투고 논문을 접수하면 전문가에 의한 심사, 즉 동료 평가(peer review)를 실시합니다. 동료 평가 후 게재할 가치가 있다고 판단되면, 경사스럽게도 학술 논문에 게재되어 같은 분야의 연구자나 기타 불특정 다수에게 공개됩니다.

다만, 인공지능 분야에서 최근의 추세는 곧 언급할 학회나 오픈된 논문 공개 시스템이 주류가 되고 있습니다.

큰 흐름을 알고 싶은 경우
학회에 참가하면 다양한 연구를 접하게 되어 폭넓은 지식을 얻을 수 있습니다. 인공지능과 관련된 권위 있는 학회를 몇 가지 소개하자면 다음과 같습니다.

• NeurIPS(머신러닝) https://nips.cc/
• AAAI(인공지능 전반) https://www.aaai.org/
• ICML(머신러닝) https://icml.cc/
• IJCAI(인공지능 전반) https://www.ijcai.org/

참고로 NeurIPS 2018의 참가 티켓 8,500여 장은 약 11분 만에 매진되어 유명 가수의 콘서트 못지 않은 인기를 실감할 수 있었습니다.

동료 평가를 통과한 논문은 ‘믿을 수 있다’, ‘품질이 보장된다’는 평가를 얻게 되고, 그것이 연구자의 사기를 진작시켜 연구 의욕을 북돋아 주지만, 전문가의 확인 과정을 거쳐야 하기 때문에 공개되기까지 어떻게든 물리적인 시간이 걸립니다. 논문의 ‘신뢰도’와 ‘신속성’은 트레이드오프(trade off) 관계로, 둘 다 만족시키기 어렵다고 할 수 있습니다.

특히, 최근 인공지능 관련 논문은 제출 수가 계속 늘어나고 있어서 동료평가가 지체되고 심사 체계가 원활하지 않은 경우가 종종 보입니다. 오픈사이언스가 대세가 되면서 최근의 인공지능 연구는 속도 경쟁이 되었습니다. 따라서 동료 평가 과정을 거쳐야 하는 기존 프로세스로는 경쟁에 대응할 수 없으므로 새로운 체계가 생겨나고 있습니다.


최신 논문에 접근하는 방법

인공지능 관련 최신 논문이 가장 빠르게 업로드되는 곳은 arXiv(아카이브)입니다. arXiv는 1991년에 등장한 프리프린트 서버(원고가 완성된 시점에 동료평가를 기다리지 않고 한 발 앞서 공개할 때 사용되는 서버)의 시초입니다. 현재는 코넬 대학교 도서관에서 운영하고 있으며, 중재자(moderator)의 선별 과정을 통해 품질에 현저한 문제가 있는 논문은 반려되지만, 수많은 최신 논문이 업로드되어 있습니다.

그림 52의 위쪽 그래프는 세로축이 논문의 게재 수를, 가로축이 연차를 나타냅니다. 투고 수가 전체적으로 급증하는 것을 알 수 있습니다. 한편, 그림 52의 아래쪽 그래프는 세로축이 투고 분야의 비율을 나타내고 있습니다. 컴퓨터 과학과 수학 분야의 비율이 증가하고 있는 것을 보실 수 있습니다.

이제까지의 논리에 따른다면 동료 평가를 기다리지 않고 공개할 수 있다는 것은 그 가치를 심사해 주는 사람이 없다는 것입니다. 그렇기 때문에 arXiv에 공개된 논문은 품질의 편차가 큰 경향이 있습니다. 애초에 학회에서 심사를 통과하기 어려운 수준의 논문도 있는 반면, 여유 있게 통과할 만한 것도 있습니다. 즉, 많은 연구자들이 주도권을 잡기 위해 가장 먼저 발표하는 자리가 되고 있습니다.

 

그림 52
 

 

최근에는 연구 성과가 나오면 일단 arXiv에 올린 다음, 다른 연구자들의 의견을 확인하고, 또 수정판을 올려서 최종판을 완성시킨 후, 성과로 남기기 위해서 학회에 제출하는 사이클을 반복하는 사례도 증가하고 있습니다.

arXiv에 있는 논문은 동료 평가 전이기 때문에 정보의 신뢰성이 낮더라도 저자의 인지도가 높거나, 소스 코드가 공개되거나, SNS에서 이슈가 되는 경우 등을 통해 여러 사람의 눈에 띄게 됩니다. 때로는 arXiv 단계에서 뛰어난 품질을 보여 줘서 미디어에서 다뤄지는 예도 드물지 않습니다. arXiv는 무엇보다도 기술 혁신(이노베이션)을 이끌어 나가는 존재가 되었습니다. arXiv의 장점을 정리하자면 다음과 같습니다.

• 신속한 공개
수개월에서 1년 정도 걸리는 동료 평가를 기다리지 않고 공개할 수 있다.

• 우위 선점
다른 연구자가 비슷한 연구를 하고 있는 경우, arXiv에 올린 기록으로 누구의 연구 결과인지 결정되는 분위기가 형성되어 있다(비록 동료 평가로 인해 그 학회 논문의 게재가 늦어지더라도 arXiv의 기록이 우선한다).

• 개방된 접근
학회지 등을 구독하지 않아도 인터넷에서 자유롭게 읽을 수 있다.


arXiv가 가져온 변화

arXiv로 인한 큰 변화 중 하나는 신속한 인용입니다. 이에 대해 유명한 일화가 있습니다. 객체 탐지(object detection)라고 하는(예를 들면 이미지에 찍혀 있는 개의 영역을 직사각형으로 추출하는) 작업으로 2015년 4월에 당시 최첨단 기법이었던 ‘R-CNN’의 개발자가 ‘Fast R-CNN’이라는 기법을 발표했습니다. 그러자 얼마 후인 2015년 6월에 ‘Faster R-CNN’이라고 하는 개량 알고리즘이 다른 사람에 의해 발표되어 당시의 벤치마크 기록을 갈아치웠습니다.

이렇게 어떤 기법이 발표되더니, 그것도 단 몇 개월 만에 최신 기록이 깨지고 학회에서 발표할 때는 이미 구식 기법이 되어 버리는 일이 빈번하게 일어나고 있습니다. ‘Fast R-CNN’의 개발자가 해당 논문을 학회에서 발표할 때 ‘~라는 식으로 지금까지 발표해 왔지만, 더 좋은 방법이 이미 나와버렸습니다’라고 말한 일화도 있습니다. 게다가 한술 더 떠 그림 53과 같이 공개 다음날 인용되는 경우도 있습니다.

 

그림 53
 


이것만은 알아 두세요!

• 인공지능 연구 발표의 장은 학술지, 학회, arXiv가 메이저다.
• 오픈 사이언스의 신속성에 대한 압박감으로 동료 평가를 기다리지 않고 공개하는 경우가 늘었다.
• 단, 우수한 논문 외에 품질이 낮은 논문도 포함되어 있다.

반응형

댓글