서막: 알파 가문의 탄생
인류 최초로 달에 첫발을 내디딘 닐 암스트롱은 “이것은 한 인간으로서의 작은 발자국이지만, 인류 전체에게는 위대한 도약(That‘s one small step for man, one giant leap for mankind)”이라는 멋진 말을 남겼습니다. 실제로 이 작은 발자국은 우주를 향한 인류의 도전을 본격화하는 계기가 되어, 우주 탐사와 관련된 각종 기술이 짧은 기간에 비약적으로 발전할 수 있었습니다.
위대한 도약의 발자국이 달에 새겨진 지 약 47년이 지난 2016년 봄, 인류의 새로운 도약은 의외로 우주가 아닌 지구의 도심 한복판에서 이루어졌습니다. 그리고 그 중심에는 멋진 말을 남길 채비를 갖춘 인류의 한 일원 대신, 차가운 심장을 가진 과묵한 인공지능 기계 ‘알파고’가 있었습니다. 알파고는 인류 최고 바둑 기사와의 다섯 번의 대국을 묵묵히 치르며 어떠한 말이나 어떠한 승리 세리머니도 하지 않았지만, 그 능력과 존재만으로 많은 사람에게 커다란 충격을 가져다주었습니다. 충격의 핵심은 아마도 ‘전혀 예상치 못한 일이 벌어졌다’보다는 ‘예상한 일이긴 했지만 이런 날(인공지능이 인간과의 두뇌게임에서 승리하는 날)이 이렇게 빨리 올 줄은 몰랐다’에 가까웠을 것입니다.
인공지능의 승리를 앞당겨 인류(혹은 인공지능)의 새로운 도약의 계기를 만들어낸 주인공은 바로 구글(정확한 주체는 구글의 지주회사인 ‘알파벳’)의 자회사인 인공지능 연구기업 ‘딥마인드(DeepMind)’입니다. 구글이 2014년에 딥마인드를 인수할 때만 해도 사실 인공지능 기술은 지금처럼 각광을 받고 있지 못했습니다. 물론 기본적으로 인공지능 기술은 인류의 오랜 관심사이자 지속적인 연구 대상이긴 했지만, 2010년대 초반만 해도 인공지능 분야는 신기술 개발의 정체와 데이터 부족으로 인해 침체기를 겪고 있는 상황이었습니다. 그래서 당시 변변한 매출도 없었던 작은 회사인 딥마인드를 구글이 4억 달러(약 4,500억 원)가 넘는 거금을 들여 인수했다는 소식이 알려졌을 때, 많은 사람이 큰 의구심을 가졌던 것이 사실입니다.
침체기에 빠져있던 인공지능 기술에 새로운 반전의 불씨를 놓은 것은 2012년 제프리 힌튼 교수(토론토 대학) 연구실이 IMAGENET(이미지 인식 경연대회)에서 딥러닝 알고리즘을 이용하여 우승한 사건이었습니다. 제프리 힌튼 교수의 딥러닝 알고리즘에 기반한 이미지 인식 기술은 인식률이 75% 수준이었던 기존 대회의 정확도를 크게 넘어서는 84.7%를 기록하게 됩니다. 인간 두뇌의 신경망 구조를 참고하여 만들어진 딥러닝 알고리즘은 당시 대중들에게는 아직 생소한 개념이었지만, 관련 분야의 많은 연구자에게는 큰 영감을 주는 기폭제가 되었고 때마침 급속히 발전되고 있던 IT분야의 하드웨어와 각종 소프트웨어 기술 환경에 힘입어 딥러닝 알고리즘의 황금기가 시작되었습니다.
알파고를 만든 딥마인드는 바로 이 딥러닝 알고리즘에 정통한 연구진들이 중심이 되어 설립한 회사입니다. 당시 ‘전 세계 딥러닝 전문가가 50명 정도 있는데 이들 중 10여 명이 딥마인드에 있다’라는 이야기가 있었을 정도였습니다. 이러한 인재들의 가치를 생각해보면, 구글이 딥마인드를 비싼 값에 인수한 것도 충분히 이해를 할 수 있는 대목입니다. 딥마인드의 창업자이자 알파고의 아버지라 할 수 있는 데미스 하사비스(Demis Hassabis) 역시, 영국에서 인공지능으로 학위과정을 밟으며 딥러닝에 대한 심도 깊은 연구에 매진한 인물입니다.
알파 가문의 계보
세계가 알파고의 압도적인 승리와 신선한 원리에 열광하고 있던 2016년, 바둑을 정복한 딥마인드는 이미 다음 도전을 준비하고 있었습니다. 도전의 한 노선은 알파고의 연장선에 있는 프로젝트로, 당시 인기 있던 전략 시뮬레이션 게임인 스타크래프트2를 운용하는 인공지능이었습니다. 이는 기존의 ‘알파고’에서 바둑을 뜻하는 ‘고’(바둑의 일본식 표기로 서양에서 바둑을 지칭할 때 많이 사용됨) 대신 스타크래프트의 ‘스타’가 들어간 ‘알파스타’로 명명되었습니다. 다른 노선은 완전히 새로운 분야에 대한 도전으로, 하사비스가 딥마인드를 설립한 궁극적인 목표이자 꿈이었던 ‘과학 문제 해결을 위한 인공지능’의 개발이었습니다. 그냥 바둑 좀 두고 게임 좀 잘하는, 이른바 ‘잡기에 능한 인공지능 셀럽’ 정도로 알파 시리즈를 생각했던 사람들에게는 이 또한 새로운 충격을 주기에 충분하였습니다. 단백질 접힘을 예측하는 인공지능 ‘알파폴드’부터 단기 강우를 예측하는 ‘DGMR’, 스스로 프로그램을 만들 수 있는 ‘알파 코드’에 이르기까지, 딥마인드의 ‘알파 가문’에서는 (지켜보는 사람이 현기증이 날 정도로) 쉴 틈 없이 새로운 인공지능 기술들을 만들어내고 있습니다.
본 글에서는 알파고 이후 딥마인드가 발표한 주요 인공지능 기술에 대해 간략하게 살펴보고자 합니다. 현시대의 중심에 인공지능이 있고, 그 인공지능 세계의 정점에 딥마인드가 있다는 점을 고려할 때 딥마인드의 인공지능 기술들은 분명 우리가 사는 세상을 어떤 식으로든 바꾸어 놓을 것입니다. 앞으로 그들이 어떤 방향으로 나아갈지 정확하게 예측하기는 어렵지만, 공개된 기술에 대해 명확하게 파악하고 대처하는 것은 급속한 성장기에 접어든 4차 산업혁명 시대를 살아갈 우리에게 있어 무엇보다 중요한 과업이 될 것입니다.
알파폴드
2021년, 세계적인 과학 학술지인 사이언스는 당해 최고의 연구성과로 단백질 접힘 예측 인공지능을 선정하였습니다. 단백질 접힘이란 단백질 서열을 구성하는 아미노산들이 상호작용을 통해 3차원의 구조를 이루는 과정을 의미합니다. 이 구조에 따라서 최종적인 단백질의 기능이 결정되며, 이 과정에 문제가 생기면 각종 질병이 발생할 수 있으므로 단백질 접힘의 메커니즘을 밝혀내는 것은 질병 치료와 신약 개발 등 현대 의학·생물 분야에서 매우 중요한 연구 대상입니다. 과학 분야로 지평을 넓힌 알파 가문의 데뷔작이 바로 이 단백질 접힘을 예측하는 인공지능인 ‘알파폴드’입니다. 알파폴드는 초기 버전이 2018년에 먼저 공개되고 이후 두 번째 버전이 공개되었는데, 두 번째 버전인 알파폴드2는 2020년 단백질 구조 예측 대회인 CASP(Critical Assessment of protein Structure Prediction)에서 이전 대회의 결과를 압도하는 놀라운 정확도로 많은 연구자에게 충격을 주며 화려하게 데뷔하였습니다. 바둑처럼 대중들에게 많이 알려진 분야가 아니기 때문에 알파고만큼 화제가 되지는 않았지만, 과학 연구 분야에 있는 많은 사람은 경이로움과 함께 이제 연구 분야의 일자리도 인공지능에 내어줄 때가 된 것이 아닌가 하는 두려움에 빠지기도 하였을 것입니다. 실제로 알파폴드가 공개된 이후 관련 분야 연구자들이 발표한 단백질 연구 논문 중에는 알파폴드의 예측 결과를 기준으로 논의를 전개하는 경우도 있다고 하니, 전혀 근거 없는 두려움은 아닌 것 같습니다.
단백질 접힘(구조) 예측이 어려운 것은 이것이 단순한 룰에 의해서 결정되는 것이 아니라 단백질 서열을 이루는 아미노산 간의 복합적인 상호작용에 따라 결정이 되기 때문입니다. 알파고 시절과 비교한다면 기본적으로 바둑보다 훨씬 더 복잡한 경우의 수를 가지고 있는 상황이라고 할 수 있으며, 이보다 더 큰 문제는 이 경우의 수가 절대적인 룰에 의해서 형성되는 것이 아니라 각 구성 물질 간 상호작용의 합으로 결정이 된다는 점입니다. 이 때문에 실험적인 방법을 통하지 않고 단백질 서열 등 데이터만을 바탕으로 구조를 정확히 예측하는 것은 불가능한 작업으로 여겨졌습니다. 그런데 딥마인드는 알파 시리즈를 만들면서 쌓아온 딥러닝 기술을 알파폴드에 적용하여 단백질 데이터와 구조 간의 패턴을 학습을 통해 찾아내어 예측을 수행하였습니다. 사람이 수동적인 방식으로는 절대로 찾아낼 수 없는, 대량의 데이터 속 복잡한 구성요소 간의 상호작용으로부터 관계모델을 만들어내는 딥러닝의 장점이 알파폴드에 백분 활용되었습니다. CASP를 정복한 알파폴드는 이제 수십 년간 인류가 밝혀낸 모든 단백질 구조 데이터보다 더 많은 양의 데이터를 높은 정확도로 예측해내는 수준에 이르렀으며, 각종 데이터와 소스 코드는 알파폴드의 홈페이지를 통해 모두 공개되었습니다.
알파폴드는 대량의 단백질 데이터를 바탕으로 매우 복잡한 연산을 수행하기 때문에 일반적인 PC 환경에서 사용하기는 어렵지만, 구글이 제공하는 온라인 공용 분석 플랫폼인 CoLab(ColabFold 웹페이지)을 이용하면 누구나 간편하게 사용해 볼 수 있습니다.
Gopher와 Chinchilla
작년 말에 공개된 ChatGPT가 요즘 연일 화제가 되고 있습니다. ChatGPT는 세계적인 인공지능 연구소 ‘OpenAI’에서 만든 언어모델인 GPT(Generative Pre-trained Transformer) 3.5를 기반으로 하는 인공지능 챗봇 서비스입니다. 방대한 데이터에 대한 학습을 바탕으로 인간의 언어를 문맥 차원에서 이해하고 자연스러운 답변을 내놓을 수 있으며, 제시된 소재나 주제에 맞게 작문이나 코딩을 할 수도 있습니다.
Gopher는 GPT와 유사한 언어모델로 2021년 말에 발표되었습니다. 언어모델의 성능에 큰 영향을 미치는 요소 중 하나는 모델에 적용되는 매개변수의 개수인데, Gopher는 1,750억 개의 매개변수를 갖춘 GPT-3보다 많은 2,800억 개의 매개변수를 갖추고 있습니다. (참고로 현재까지 발표된 언어모델 중 매개변수가 가장 많은 두 모델은 마이크로소프트의 Megatron-Turing LNG(5,300억 개)와 구글의 PaLM(Pathways Language Model)(5,400억 개) 입니다.) 매개변수는 너무 많아도 과적합이나 학습 속도 지연 등의 문제를 일으킬 수 있으므로 Gopher는 적절한 매개변수를 가지면서 전반적인 알고리즘의 성능을 향상하는 것에 중점을 두고 개발되었습니다.
ChatGPT가 많은 관심을 받고 있고 향후 포털 사이트의 검색 기능을 대체하게 될 것이라는 전망까지 나오는 상황에서, 딥마인드도 대중을 대상으로 하는 챗봇 서비스를 조만간 공개할 것으로 보입니다. 순수 언어모델 기술에 관해서는 OpenAI가 더 많은 노하우를 가지고 있는 것으로 알려져 있으나, 향후 사람들이 언어모델에 기대하는 소통의 수준이 더욱 전문적인 단계로 상향될 가능성이 다는 점에서 봤을 때는 과학 분야에서 여러 모델을 만들어 온 저력이 있는 딥마인드가 역전할 가능성도 있습니다.
대중을 대상으로 하는 인공지능 챗봇 서비스를 위해 딥마인드는 이미 지난해 3월, Gopher 등 기존 언어모델의 알고리즘 개선을 통해 전반적인 성능을 향상한 모델인 Chinchilla를 발표하였습니다. 같은 해 말에는 이 모델을 이용한 챗봇인 Sparrow를 (논문을 통해) 공개하기도 하였습니다. Chinchilla의 매개변수는 700억 개로 기존의 대규모 언어모델에 비해 적은 편이지만, 거의 모든 측정작업에서 대부분의 언어모델에 비해 더 나은 정확도를 달성하였습니다. Chinchilla와 같이 규모가 작으면서 성능이 뛰어난 모델은 추론 시간이 짧고 전산 자원의 사용량이 적기 때문에 훨씬 더 빠르고 효율적으로 동작할 수 있는 장점이 있습니다. 딥마인드는 이렇게 최적화된 언어모델을 바탕으로 하는 챗봇 서비스(Sparrow 또는 새로운 서비스)를 올해 상반기에 대중에게 공개할 예정인 것으로 알려져 있습니다. 다만 인공지능 기술의 윤리와 사회적 책임에 대해서도 많은 관심을 가지고 있는 딥마인드의 가치관에 비추어 봤을 때는, 급하게 서비스를 공개하려고 하기보다는 최대한 잘 다듬어서 공개할 가능성이 큽니다.
Plasma Control
2022년 초, 세계적인 학술지 Nature에 인공지능과 관련된 놀라운 연구 결과가 발표됩니다. 딥마인드의 연구진들과 스위스 플라스마 센터가 공동으로 수행한 이 연구는 핵융합 원자로의 플라스마를 인공지능을 이용하여 제어하는 알고리즘에 관한 내용이었습니다. ‘딥마인드가 별걸 다 하네?’ 정도로 생각하고 넘어갈 수도 있겠지만, 이것은 연구실이나 온라인 세계에만 존재하던 딥마인드의 인공지능 기술이 이제 우리가 사는 실제의 물리 공간으로 진출했음을 알리는 화려한 신호탄이라고 볼 만한 사건이었습니다.
핵융합을 통한 전기 생산 과정에는 도넛 모양의 토카막이라고 하는 장치가 사용되는데, 이 장치는 내부의 자기 코일을 통해 핵융합 과정에서 가장 중요한 요소인 플라스마를 제어합니다. 핵융합 발전의 효율이 플라스마에 따라 결정되기 때문에 이를 적절하게 다루는 것은 매우 중대한 작업입니다. 딥마인드는 강화 학습 알고리즘을 바탕으로 플라스마를 가장 잘 다룰 수 있는 전체 코일의 전압을 산출해내었고, 이 결과는 실제 장치에서의 실험으로 이어졌습니다. 이 연구는 이후에도 계속 이어질 전망이며, 장기적으로는 이 인공지능 모델을 실제로 적용한 핵융합 발전소가 지어질 가능성도 있습니다.
Gato (Generalist Agent)
Gato는 범용적으로 활용 가능한 인공지능입니다. (Gato라는 이름부터가 ‘범용적인 수행원(Generalist Agent)’의 줄임말입니다.) 기존의 인공지능 연구가 대부분 특정 목적(바둑, 단백질 구조 예측, 강우 예측 등)을 수행하는 것에 초점을 맞추었다면 범용 인공지능은 보다 사람에 가까운 인공지능을 만드는 것에 목적을 두고 있습니다. 예를 들면 사진을 보고 내용을 언어로 표현하거나, 상대와 자연스럽게 대화(채팅)하는 행위들이 그것입니다. 또한 Gato에는 로보틱스 분야와 연계하여 로봇팔에 명령을 내려 동작을 제어하는 알고리즘도 탑재되어 있습니다. 위에서 소개한 플라스마 연구가 과학 분야에서의 물리 세계 진출 신호탄이라면, Gato는 산업 분야와 실생활 분야에서의 물리 세계로 진출하는 초석이라 볼 수 있는 대목입니다.
지난해 중반에 공개된 Gato가 그 이름대로 진정한 ‘범용적 인공지능’으로 완성되려면 아직은 시간이 필요해 보이지만, 앞으로 세계의 새로운 중심 산업으로 떠오르고 있는 로보틱스 분야와의 지속적인 협연을 통해 산업 분야와 실생활 등 물리 영역에서의 인공지능 혁신을 주도할 가능성이 큽니다.
알파 가문의 번창과 우리의 미래
딥마인드는 지난 2022년 한 해에만 156건의 인공지능 관련 연구 논문을 발표하였습니다. (딥마인드에서 발표한 논문 목록) 이들 중 주요 프로젝트에 해당하는 연구들은 인공지능 분야의 유력 학술지나 Nature와 같은 세계적인 과학 학술지를 통해 발표되어, 여전히 세계인들의 관심사가 인공지능을 향해 있음을 보여주는 방증이 되기도 하였습니다. 한 달에 열 편 이상 발표되는 연구 논문과 거의 3~4주 간격으로 공개되는 연구 프로젝트의 속도를 고려할 때, 올해에도 딥마인드에서는 새로운 연구 성과들을 많이 쏟아낼 것으로 예상됩니다. 경이로운 기술에 전율을 느끼고 싶은 평범한 지구인으로서는 몹시 기대되는 부분이지만, 생물정보 분야에서 직간접적인 경쟁을 하게 될 수도 있는 주변국의 기술자로서는 두려움이 느껴지는 것도 사실입니다.
다행히 우리나라도 삼성전자와 빅테크 기업들을 중심으로 인공지능에 관한 연구와 기술개발을 활발하게 진행하고 있습니다. 특히 희망적인 부분은 좋은 기술을 갖춘 중소기업들의 탄생과 약진이 계속 이어지고 있다는 점입니다.
인실리코젠의 경우 세계적인 인공지능 부흥이 일어나기 시작한 2010년대 중반부터 발 빠르게 생물정보 분야를 중심으로 하는 인공지능 기술에 관한 연구와 기술 개발을 추진해왔습니다. 수천만 건의 생물 복잡계 연관정보를 분석하여 구축한 맞춤형 식품 추천 알고리즘을 통해 다양한 서비스를 제공 중이며, 인공지능 이미지 분석을 통한 객체 특성 추출 기술의 구축, 딥러닝을 활용한 디지털 육종 연구 등을 활발하게 수행하며 생물정보 분야에서 인공지능을 통한 새로운 길을 열어가고 있습니다.
마치며
앞으로 알파 가문의 위세는 어디까지 이어질까요? 섣부른 예상일 수 있겠으나 가까운 미래에 알파 가문에서 노벨상 수상자가 나오거나, 21세기의 가장 위대한 과학자로 알파 가문이 선정될 날이 올 가능성도 없지 않을 것 같습니다. 비록 우리나라 기업들이 딥러닝 기술로 촉발된 인공지능의 새로운 부흥기에 초기부터 참여하지는 못하였지만, 특유의 근성과 도전정신을 바탕으로 가까운 시일 내에 함께 어깨를 맞추어 갈 수 있으리라 생각합니다.
우리가 알파 가문을 비롯한 인공지능 분야의 선진 사례로부터 배워야 할 점은, 최신 기술의 원리나 노하우 외에도 누구나 자유롭게 새로운 연구에 도전할 수 있는 선순환이 가능한 인공지능 생태계(인적/물적 Pool)의 조성, 지적 기술과 인재의 중요성을 인정해주는 정부와 기업의 자세, 그리고 데이터와 기술의 가치를 독점이 아닌 공유를 통해 새롭게 만들어갈 수 있는 사회적 분위기 등이라고 생각합니다.
2010년대 중반부터 단기간에 인공지능 분야가 많은 발전을 거듭해왔지만, 아직 특이점(인공지능이 인간의 지능을 넘어서는 지점)에 도달할 정도에 이르지는 못하였습니다. 또한 아직까지도 인공지능이 스스로의 연산 과정에 대해 투명하게 설명할 수 없는 점, 여전히 학습 데이터에 대해 의존적인 점, 사회·윤리적으로 발생할 수 있는 여러 문제점에 대한 명확한 대안이 아직 제시되지 못한 점 등 앞으로도 발전시키고 채워나가야 할 부분들이 많이 있습니다. 이 과정에서 우리나라 기업들이 이바지할 수 있는 부분이 분명 많이 있을 것이며, 저희 인실리코젠 역시 생물과 헬스케어 분야를 중심으로 점진적으로 역할을 키워나갈 것입니다.
그건 그렇고, 그래서 대체 알파 가문의 막내아들은 누구일까요? 알파 가문의 후계자들이 올해는 또 어떤 분야에서 멋지게 데뷔하며 많은 사람에게 영감과 전율을 선사해줄지 벌써 기대가 됩니다. 아직은 그들 모두 멀리 앞서 있어 잘 보이지도 않지만, 조만간 우리와 함께 뛰며 고민을 나눌 수 있는 경쟁자이자 동료가 될 날이 올 것이라 믿으며 글을 마칩니다.
참고자료
- DeepMind 공식 홈페이지 https://www.deepmind.com/
- AlphaFold 소개 페이지 https://www.deepmind.com/research/highlighted-research/alphafold
- Plasma 제어기술 소개 페이지 https://www.deepmind.com/blog/accelerating-fusion-science-through-learned-plasma-control
- Gato 소개 페이지 https://www.deepmind.com/blog/a-generalist-agent
- AlphaCode 소개 페이지 https://www.deepmind.com/blog/competitive-programming-with-alphacode
- ChatGPT 공식 홈페이지 https://chat.openai.com/
- 단백질 접힘 이야기 https://horizon.kias.re.kr/21532/
- 올해의 과학 성과에 ‘단백질 구조 예측 인공지능’ https://www.hani.co.kr/arti/science/science_general/1023734.html
- 딥마인드도 초거대 언어모델 고퍼 공개 https://www.aitimes.com/news/articleView.html?idxno=141939
- 인공지능의 역사와 기술의 분류 https://saintbinary.tistory.com/21
- 데미스 허사비스가 딥마인드를 설립한 이유 https://www.technologyreview.kr/%EB%8D%B0%EB%AF%B8%EC%8A%A4-%ED%97%88%EC%82%AC%EB%B9%84%EC%8A%A4%EA%B0%80-%EB%94%A5%EB%A7%88%EC%9D%B8%EB%93%9C%EB%A5%BC-%EC%84%A4%EB%A6%BD%ED%95%9C-%EC%9D%B4%EC%9C%A0/|https://www.technologyreview.kr/데미스-허사비스가-딥마인드를-설립한-이유
- 2022년 인공지능 동향 https://keri.koreaexim.go.kr/HPHFOE052M01/102021?curPage=1
- 데미스 하사비스 타임지 인터뷰(2023년 1월) https://time.com/6246119/demis-hassabis-deepmind-interview/
EDITOR
서승원
Daejeon Branch · Deputy Principal Developer
'STORAGE' 카테고리의 다른 글
"ChatGPT"가 뭐길래?! (0) | 2023.04.10 |
---|---|
[LabStory] 충북대학교 조성진 교수님 편 (0) | 2023.03.27 |
산모 혈액을 이용한 비침습 산전 검사(NIPT)란? (0) | 2023.02.27 |
트렌드 코리아 2023 : 더 높은 도약을 준비하는 검은 토끼의 해 (0) | 2023.01.30 |
2023년 웹 개발 트렌드 (0) | 2023.01.16 |
댓글