코로나19 영향으로 사회 시스템이 전반적으로 변화하면서 대규모 데이터 축적과 함께 인공지능(AI) 수요가 급격히 증가했다. AI 발전에도 더욱 가속이 붙었다. 이를 입증하듯 구글은 2021년 5월 사람처럼 대화가 가능해 비대면 환경에서 다양하게 활용 가능한 AI 대화 모델 '람다'를 선보였다. AI 칩을 만드는 엔비디아는 2020년 10월 영상회의 관련 AI 플랫폼인 '맥신'을 공개했다.
특히 2020년 5월 발표된 오픈(Open)AI의 GPT-3는 AI 기술 발전에 중요한 변곡점이 됐다. 이 기술은 인간 뇌의 뉴런에 해당하는 파라미터 수가 1750억개다. 2018년 10월 발표된 구글의 BERT 대비 500배 이상인 수준이다.
이제는 기존 AI의 인공신경망 크기를 압도하는 초거대 AI 기술이 등장하며 새로운 패러다임의 전환을 맞고 있다. 사물과 상황을 인식해 새로운 이미지를 생성하거나 검색할 수 있는 비전 분야의 인공지능 기술도 초거대 AI로 인해 빠르게 발전하고 있다.
구글, 마이크로소프트 등 해외 IT 기업과 더불어 국내 회사도 초거대 AI 개발과 대규모 투자를 선언하며 본격 경쟁에 뛰어들었다. 초거대 AI에 대한 기업의 투자 경쟁에는 더 나은 인간의 삶을 앞당길 수 있다는 긍정적 기대도 많은 반면 핵심 기술 독점에 대한 우려도 따른다.
오픈(Open)AI는 비영리 연구기관임에도 불구하고 GPT-3 상용화 권리를 마이크로소프트가 독점하고 있다. 마이크로소프트는 1조원 규모 투자를 진행하며 초거대 AI의 상용화 우위를 단숨에 선점했다. 대규모 투자 없이는 진입할 수 없는 장벽을 구축했다.
그러나 모든 기업이 마이크로소프트처럼 독자적 초거대 AI를 만드는 데 뛰어들기는 쉽지 않다. 현존하는 최고 성능의 학습용 GPU 1120장을 투입하더라도 사전 학습에만 2개월이 걸리는 대규모 컴퓨팅 자원을 필요로 하기 때문이다. 대규모 투자 없이는 섣불리 뛰어들기 힘든 실정이다.
AI 연구의 중추를 담당하는 학계도 고민이 깊다. AI와 관련된 좋은 연구 성과를 위해서는 대규모 인프라 투자가 필요한데, 이는 단일 학교가 투자하기 어려운 규모다.
개방형 시스템은 언제나 눈부신 기술의 발전과 활용성 확대라는 두 마리 토끼를 잡아왔다. 현재 AI 근간이 되는 딥러닝 기술 발전과 적용 확대 측면에서 오픈소스 문화가 기폭제 역할을 했음은 분명하다.
만약 다양한 딥러닝 기반 AI 기술의 연구 결과물을 공개하지 않고 폐쇄적으로 운영했다면 단기간에 이렇게 많은 발전을 이루기는 어려웠을 것이다.
초거대 AI도 결국 개방형 생태계를 구축하는 것이 핵심이다. 개방형 생태계는 AI 활용의 증대, AI 신기술 발전이라는 톱니바퀴의 운행 속도를 가속화할 것이다.
그러나 초거대 AI는 개방형 생태계와는 또 다른 새로운 생태계를 필요로 할지도 모른다. 많은 기업과 스타트업, 학계는 AI 학습을 위해 전향적인 AI 기술의 공개와 공유를 점점 더 필요로 할 것이다. 소스코드를 공개하면 경쟁력을 상실할 것이라는 기존의 고정 관념을 타파하고 오픈소스 개념이 등장한 것만 보아도 알 수 있다.
컴퓨팅 인프라와 데이터도 더 이상 특정 기업의 독점적 핵심 자산으로 여기지 않아야 한다. 모두와 공유해 더 발전된 생태계를 만들고 수준 높은 연구 성과물을 창출해야 한다는 의식의 개선이 필요하다.
그래야만 대기업과 학계, 스타트업 모두 시너지 효과를 창출하고 최고 수준의 AI 인재를 배출, AI 강국이 되는 토대를 만들 수 있다. 정부 또한 AI 기술 발전이 가속화될 수 있도록 데이터 활용에 대한 법과 제도를 정비해 사회 시스템 발전의 촉매 역할을 담당해 줄 것을 기대한다.
배경훈 LG AI연구원장 pr_brand@lgresearch.ai