[ET단상]공개와 공유 DNA는 4차 산업혁명의 핵심

4차 산업혁명의 핵심 기술인 인공지능(AI)은 공개 소프트웨어(SW)로 말미암아 진화하고 있다. 지금까지 공개된 AI 분야 공개 SW는 42종이다. 왜 공개 SW일까. SW 개발의 결정체인 소스코드를 무료로 공개한다는 점은 기업 입장에서 얼핏 볼 때 이해가 안 된다. 결론을 말하면 공개 SW를 활용한 수익 모델은 존재한다. 공개 SW는 라이선스가 여러 개 있다. 라이선스 모델을 예로 들어 개인 사용자나 연구 목적으로 활용할 때는 무료지만 상용화 서비스로 개선하면 일정 로열티를 지불해야 하는 책무가 발생한다. 공개 SW 대표 플랫폼인 안드로이드는 지금까지 약 310억달러의 매출을 기록했다. 공개 SW가 막연히 무료로 사용한다는 점에만 치중, 그 이면에 있는 가치를 간과하기 쉽다.

글로벌 정보기술(IT) 기업은 AI 공개 SW 전선에 적극 참여하고 있다. 이러한 현실은 공개 SW의 영향력이 얼마나 막대한지 직접 증명한다. 지난 1월 구글이 발표한 머신러닝(기계학습) 공개 SW 텐서플로가 대표 사례다. 후발 주자임에도 구글이 대열에 합류한 이유는 머신러닝 공개 SW 생태계의 잠재력이 그만큼 크기 때문이다.

[ET단상]공개와 공유 DNA는 4차 산업혁명의 핵심

이 잠재력은 구글 클라우드 서비스인 `머신러닝 플랫폼`에 여실히 나타난다. 머신러닝 플랫폼은 AI 학습을 위한 고성능 컴퓨팅 인프라를 제공하는 서비스다. 여기서 중요한 것은 머신러닝 플랫폼을 활용하는 도구가 텐서플로라는 점이다. 학습 기반의 AI 기술은 대체로 막대한 양의 계산과 데이터를 요구한다. 구글은 AI 연구 특성을 미리부터 파악하고 전략 차원에서 텐서플로를 공개했다. 이것은 기업 수익으로 연결된다고 볼 수 있다. 관건은 더 많은 사람이 텐서플로를 활용할 수 있는 `생태계 선점`이다.

공개 SW의 또 다른 장점은 공유로 개선될 수 있다는 것이다. 이미지 인식, 음성 인식 등 여러 분야에서 머신러닝의 효용성이 증명되면서 많은 연구 개발자가 AI 연구에 동참하고 있다. 머신러닝은 다양한 데이터를 학습, 패턴을 인식하는 도구다. 이러한 보편성 때문에 심층 학습(딥 러닝)을 비롯한 AI 기술은 하루가 다르게 발전하고 있다. 대기업도 따라가기 힘들 정도다. 이러한 이유에서 공개 SW 전략을 펼친다고 볼 수 있다. 사용자가 직접 개선에 참여, 공개 SW가 진화한다는 것이다.

AI 기술 역시 공개 및 공유 정신과 궁합이 잘 맞는다. AI는 말 그대로 지능을 모사하는 컴퓨터 프로그램이다. 지능은 철학이나 생리학으로도 규명하기 어렵다. 하물며 기계 지능도 완성도를 판단하기가 어렵다. 요점은 AI의 경우 끊임없이 개선될 여지가 있다는 것이다. 이에 따라서 AI 분야는 폐쇄 성격의 패키지 SW 개발 방법으로는 한계가 분명할 수밖에 없다.

우리나라 AI 연구는 어떤 전략을 취해야 할 것인가. 나는 공개 SW에 있다고 본다. 그러나 구글처럼 머신러닝 공개 SW를 개발하자는 것은 아니다. 머신러닝 관련 공개 SW는 이미 치열한 경쟁을 치르고 있다.

우리는 이것을 사용, 새로운 서비스 창출에 집중해야 한다. AI 기술에는 사회〃문화 측면에서 의존성이 존재한다. 지역 및 문화 특성에 의거한 AI 연구는 새로운 가치를 창출할 수 있다. 한국어 자연어 처리 기술은 우리가 시도할 수 있는 AI 연구의 대표 사례다. 4차 산업혁명이라는 흐름에 대비하기 위해서는 산·학·연 전문가 집단의 개방, 공유, 자발 참여 의식이 무엇보다 중요한 시점이다.

추형석 소프트웨어정책연구소 연구원 hchu@spri.kr