[ET시론]과학에서 국가 전략까지, 무엇이든 데이터로 설명할 수 있는 사회 온다

김재수 한국과학기술정보연구원(KISTI) 원장
김재수 한국과학기술정보연구원(KISTI) 원장

175제타바이트(ZB·10의 21제곱). 미국 시장조사기관 IDC가 오는 2025년에 인류가 생산할 것으로 예상하는 디지털 정보량이다. 이를 일반 태블릿(128GB)에 저장한 뒤 쌓으면 지구와 달(557.704㎞)을 29번이나 오갈 수 있는 거리가 된다. 실로 엄청난 양이다.

굳이 연구 활동을 통해서가 아니더라도 현대인은 일을 하고 의식주를 해결하거나 여가를 보내면서 매 순간 엄청난 양의 데이터를 생산한다. 그것을 분석해서 새로운 인사이트를 얻고 가치를 창출하는 작업이 정부·기업 등 경제 주체의 핵심적인 경쟁력 확보 수단이 되면서 수년 전부터 데이터 앞에 '21세기 원유'라는 수식어가 자연스럽게 붙기 시작했다. 또 마이데이터 활용이 늘어나면서 이제는 데이터를 다루는 전문 분야 사람이 아니더라도 데이터 중요성을 인식하고 활용하려는 경우가 많아지고 있다.

이런 데이터의 기술적·경제적 중요성은 이미 잘 알려진 사실이다. 필자는 기존 담론에서 한발 더 나아가 데이터가 국가사회 전반에 가져올 패러다임 전환을 얘기하고자 한다. 구체적으로 데이터가 국민 삶의 질 향상을 위해 어떠한 문제를 해결할 수 있는지, 궁극적으로 투명사회·신뢰 사회 구현에 어떻게 기여할 수 있는지에 관한 얘기다.

먼저 데이터를 활용하면 개별적 문제를 맞춤형으로 해결할 수 있다. 지방자치단체가 골머리를 앓는 난제를 예로 들어보자. 부산시는 국가 여러 기관이 보유한 다양한 공공데이터와 지자체 데이터를 결합·가공·표준화해서 상황별 최적의 침수·지진·미세먼지 대응 시나리오를 짰다. 시간당 몇 ㎜의 비가 내릴 때 어떤 지역의 침수 공산이 큰지, 실제 침수가 발생하면 몇 번 버스를 타고 어디로 대피해야 하는지 등을 지도상에 실시간으로 구현하는 식이다.

[ET시론]과학에서 국가 전략까지, 무엇이든 데이터로 설명할 수 있는 사회 온다

또 양산부산대병원은 국내 상급병원들과의 데이터 공유를 통해 후두암과 치주질환을 진단·예측하는 솔루션을 개발했다. 이와 함께 이렇게 개발한 솔루션을 다른 문제를 해결하는 데 활용할 수 있도록 오픈지식플랫폼도 구축했다. 이미 울산시, 대전시 등 여러 지자체가 러브콜을 보내는 상황이다. 이 같은 프로젝트는 국가과학기술연구회(NST) DDS융합연구단을 통해 진행됐다. 이 융합연구단은 한국과학기술정보연구원(KISTI)이 주관하고 한국전자통신연구원이 참여하고 있다.

필자는 이 사례가 시작에 불과하다고 생각한다. 당장은 이 데이터로 지자체와 상급병원 등의 대형 문제를 해결했지만 머지않은 미래에 인터넷을 쓰듯 누구나 일상에서 데이터 분석을 활용하는 환경이 마련되면 동네의 작은 가게가 겪고 있는 문제, 개별 가정과 개인 문제 역시 데이터로 손쉽게 해결할 수 있을 것이다.

데이터를 이용하면 그동안 접근하기 어렵던 미개척 분야를 혁신적으로 진화시킬 수도 있다. 소리 데이터가 대표적이다. 공장에서나 자동차·기기·장비 등에 이상이 생길 때 소리가 달라진다는 사실은 다 알고 있지만 데이터와 데이터를 다루는 기술, 데이터를 학습해서 상황 인식과 심층적 판단을 내리는 인공지능(AI) 기술이 발전하지 않은 시절에는 소리 차이를 활용하기 어려웠다.

그러나 소리의 세기·높낮이·음색·주파수 등을 숫자로 데이터화하고 이를 축적해서 딥러닝을 진행하면 매우 다양한 분야에 활용할 수 있다는 것이 증명되고 있다. 실제로 국내 최대의 산·학연 협의체인 회원 1만2000여명 규모의 과학기술정보협의회(ASTI)는 소리기술 지식연구회를 조직해 소리 데이터를 화학 공장 안전 시스템과 철도차량 장애예측, 경호·경비 등에 적용할 수 있는지 여부를 연구하고 있다. 이러한 기술이 더 진화하면 간단한 소리 센서로 개인의 건강과 안전을 실시간으로 지키는 것도 가능할 것으로 보인다.

무엇보다 데이터는 국가사회 전 분야로 '과학화' 패러다임을 확산할 것이다. 과학화, 즉 과학원리를 이용해 데이터로 설명할 수 있는 체계를 만든다는 의미다. 의료·농업·경제·국방, 심지어 문화예술까지 모두 데이터로 설명할 수 있다.

지금까지 의사결정은 주로 수장이나 상급자·전문가·대표자의 경험·직관·전문성에 의존해 진행됐다. 국가사회 등 대부분의 분야가 그러했을 것이고, 사실 과학기술 분야의 의사결정도 아직 미흡하다. 이렇게 소수의 특정인에 의해 의사결정이 이뤄지면 편향적 사고나 이익 관계에 치우쳐서 잘못된 결정이 나오기도 하고, 이를 따르는 사람들도 신뢰하기 어려우며, 결정 오류로 인한 책임소재도 불분명해진다.

과학화는 이러한 문제를 해결해 줄 가장 효과적인 솔루션이다. 기업 의사결정의 과학화를 예로 들어보자. 기업이 새로운 기술과 제품을 개발해서 사업화하는 데까지는 여러 단계에 걸친 복잡한 의사결정 과정이 필요하다. 중간에 하나의 의사결정에만 오류가 생겨도 기업은 큰 손실을 볼 수밖에 없다. 이를 보완하기 위해 최근 많은 기업과 지자체, 테크노파크 등이 KISTI의 데이터 기반 AI 기술사업화 지원 플랫폼을 활용하고 있다.

이 플랫폼을 이용하면 특정 기업의 강점과 단점이 무엇인지, 어떤 분야에 새롭게 도전하는 것이 유망한지, 해외로 진출하려면 어떤 부분을 더 강화해야 하는지 등 기술사업화 전 과정이 간단한 숫자(데이터)로 설명된다. 물론 전문가의 의견도 필요하고 최종 결정을 내리는 건 기업 대표겠지만 데이터는 여기에 증거기반(Evidence-Based)을 더함으로써 객관성과 신뢰성을 확보해 준다. 플랫폼의 인기가 날로 커지는 것은 기술사업화의 과학화가 그만큼 효과적이라는 것을 보여 준다.

지난 30여년 동안 정부출연연구기관(출연연)에서 연구자로서, 기관장으로서 몇 번의 큰 변환점을 겪었다. 최근 1~2년 사이에 급속도로 체감하는 것은 데이터 기반 과학화로의 빠른 전환이다. 필자가 몸담은 KISTI는 과학기술 데이터 종합연구기관으로서 과학화 흐름을 견인하는 역할을 한다. 그러다 보니 정말 다양한 분야로부터 과학화 관련 문의를 받고 있다. 앞에서 설명한 기술사업화는 단적인 예이고 국방과 농업을 비롯해 국민 생활안전 경비 분야, 국회와도 과학화 관련 프로젝트를 진행하고 있다다.

특히 지난해부터 국회도서관과 국가전략정보 협의체, 국회사무처의 '국가 전략·정책 빅데이터(가칭)' 구축에 참여하고 있는 것은 의미가 남다르다고 생각한다. 국회의 과학화가 국민 생활 전반에 가져올 파급력이 매우 크기 때문이다. 이 협력체계의 요점은 국가적·국민적으로 중요한 정책 데이터를 통합하고 지능형 플랫폼에서 제공함으로써 국회의원들이 데이터에 기반을 둔 가운데 정책의제를 설정하고, 의사결정을 진행하며, 평가 또한 데이터 기반으로 받도록 하자는 것이다. 그 과정에서 KISTI의 데이터와 데이터 기술·플랫폼은 매우 중요한 혁신의 토대가 될 것으로 보인다.

국회의 과학화가 성공적으로 추진되면 어떤 일이 벌어질까. 우선 국민의 니즈가 온전히 담긴 데이터를 근거로 국회의원들은 훨씬 더 국민의 피부에 와 닿는 전략·정책을 제안할 수 있을 것이고, 정치적 성향이 다른 정책이라도 데이터로 설득이 가능하다면 정쟁 없이 수용하기 쉬워질 것이다. 또 정치의 투명성이 높아지면서 국민은 특정 정책이 정치적 이익 때문에 제안된 것인지 진정으로 국민을 위한 것인지를 정확히 판단할 수 있게 된다. 결국 국회에 대한 국민의 신뢰가 높아져서 반목과 대립에 따르는 사회적 비용도 크게 줄 것으로 예상된다.

아직도 데이터와 데이터 기술·플랫폼이라는 단어를 낯설게 느끼는 사람이 많다. 중요성을 아는 사람도 보통 경제적 효능에 포커싱을 한다. 그러나 필자는 데이터가 인문학과 밀접하게 맞닿아 있다고 생각한다. 처음은 과학기술의 진보에서 시작했지만 궁극적으로는 인간의 가치와 삶의 질에 큰 영향을 미치게 될 것이기 때문이다.

이제는 데이터와 데이터 활용을 연구자들의 전문적인 영역으로 치부하는 대신 투명사회와 신뢰 사회를 이끄는 하나의 문화로 접근해야 할 때라고 생각한다. 과학기술 연구 과정과 성과는 물론 의사의 처방, 재난재해에 대응하는 지자체의 시나리오, 국회의원의 정책, 국방 전략 등 국가전략을 통해 국민이 더 나은 내일을 위해 할 수 있는 모든 결정과 행위를 데이터로 선명하게 설명할 수 있는 시대가 오고 있다.

물론 데이터의 품질과 규모, 데이터 속에서 진짜 의미를 찾아내는 전문성, 데이터 접근성을 높이는 플랫폼 등 선결해야 할 과제도 많다. 그러한 기술적인 문제는 KISTI 같은 연구기관들이 협력해서 해결해야 할 부분이다. 그와 함께 데이터를 바라보는 포용적이고 거시적인 국민적 시선도 필수적일 것이다.

김재수 한국과학기술정보연구원(KISTI) 원장 jaesoo@kisti.re.kr

〈필자〉 김재수 KISTI 원장은 30여년 동안 한국과학기술정보연구원(KISTI)에서 근무하고 있다. 데이터·소프트웨어(SW) 분야에서 활약했다. 2008년부터 9년 동안 NTIS 사업단장으로 있었고, 국가과학기술데이터본부장직도 맡았다. 과학기술연합대학원대학교(UST) 과학기술정책 전공 책임교수, 차세대 정보컴퓨팅기술개발 사업추진위원회 민간위원, 빅데이터 민간 합동 태스크포스(TF) 위원, 과학기술출연기관장협의회장, 한국융합학회 상임고문, 한국기술혁신학회장, 한국콘텐츠학회 부회장, 한국정보관리학회 부회장, 과학기술출연기관장협의회 회장 등을 역임했다.