[창간 34주년 기획 3-流](12)빅데이터

올초 인공지능(AI) 알파고(Alphago)가 이세돌 9단과 세기의 대결을 벌여 승기를 잡을 수 있었던 가장 큰 배경은 16만건에 달하는 기보 데이터 학습이다. 알파고는 대량의 기보를 통해 이세돌의 포석을 이길 가능성이 높은 수를 확률 연산을 통해 찾아내는 방식으로 승리했다. 대량의 데이터를 통해 새로운 가치를 창출하는 빅데이터가 없었다면 알파고 승리는 힘들었을 것으로 보인다.

우리 미래를 바꿔 놓을 AI를 구현하기 위해서는 빅데이터 기술이 필수다. 기존 패턴과 변화를 분석해 가장 확률이 높은 쪽을 선택하고 행동하는 것이 바로 AI다.

AI로 대표되는 4차 산업혁명 핵심도 빅데이터라고 할 수 있다. 데이터 수집량이 기하급수적으로 많아지는 4차 산업혁명 성공 여부가 `빅데이터`에 달려 있다고 해도 과언이 아니다. 데이터를 보다 많이 수집하고 관리·분석할 수 있는 빅데이터 툴을 가지고 있는 이가 4차 산업혁명 승자가 될 것으로 예상된다.

ⓒ게티이미지뱅크
ⓒ게티이미지뱅크

◇어떻게 활용되고 있나

온라인 쇼핑몰에 접속하면 때때로 해당 연령대나 지역민이 좋아할 만한 상품들이 추천 리스트에 오른다. 미국 전자상거래업체인 아마존닷컴은 기존 고객의 구매내역을 분석해 추천상품 목록을 제공하는 것이 대표적이다.

애플 음성안내서비스인 시리는 서비스 출범 당시 인식률이 낮다는 비난을 들었지만, 이용자들이 많아지면서 좀더 정확한 서비스가 가능하게 됐다. 시리 이용자 언어에 대한 빅데이터가 쌓인 덕이다.

최근 일본 국토교통성은 올초 빅데이터를 활용해 교통정체, 사고방지를 위한 도로정비대책을 시행한다고 발표했다. 이에 앞서 일본 오사카시는 빅데이터로 교통사고를 예측할 수 있는 지도를 작성했다. 교통사고 데이터를 분석해 교통사고가 날 만한 위험한 조건과 장소를 표시한 것이다. 운전자들은 이 지도를 통해 교통사고가 일어나지 않도록 조심할 수 있고, 정부는 교통 인프라 개선에 활용할 수 있다.

암과 같은 각종 질병 치료에도 활용될 수 있다. 암환자 유전체를 수집해 암 유전자를 예측하는 시스템이 가능해졌다.

바이오 빅데이터가 농업 패러다임을 바꾸고 있다. 재래농업을 선진화하기 위해 농생물유전자원 등 바이오 빅데이터 접목이 활발하게 진행되고 있다.
바이오 빅데이터가 농업 패러다임을 바꾸고 있다. 재래농업을 선진화하기 위해 농생물유전자원 등 바이오 빅데이터 접목이 활발하게 진행되고 있다.

최근 국내 신용카드 회사들은 연령·지역별 이용분포를 발표하고 있는데, 이를 잘 분석하면 고객 맞춤형 광고를 내는 등 타깃에 잘 맞는 마케팅을 할 수 있다. 국내 신용카드 회사들은 모두 빅데이터 전담조직을 꾸리고, 이를 활용할 수 있는 마케팅 방안을 찾고 있다. 백화점들은 고객 구매 습관·동선 데이터를 분석해 매장을 배치하는 데 활용하기도 한다.

◇빅데이터, 문제점은 없나

빅데이터가 없는 마케팅은 생각할 수 없는 시대가 됐으나, 빅데이터의 어두운 면도 드러나고 있다. 데이터를 수집하면서 개인정보 침해에 대한 우려도 커지고 있다. 데이터 수집과 분석 과정에서 자신의 사생활이 드러날 수 있으며 개인정보 유출 가능성도 높아지기 때문이다.

이에 따라 행정자치부는 미래창조과학부, 방송통신위원회 등 관계부처 합동으로 지난 6월 `개인정보 비식별 조치 가이드라인`을 발간했다. 데이터 수집 과정 중 개인을 파악하지 못하도록 하는 조치라고 할 수 있다. 사실 개인정보 개념이 모호하고 비식별 조치 기준이 명확하지 않아 빅데이터 활용에 어려움이 많았다. 정부 가이드라인은 개인정보도 보호하고 빅데이터 활용도 높일 수는 역할을 할 것으로 기대된다.

가이드라인에 따르면 개인정보가 아닌 경우에는 별도 조치없이 활용할 수 있으며, 개인정보에 대해서는 가명처리, 데이터삭제, 데이터 마스킹 등을 통해 개인 식별요소를 제거하도록 했다. 이러한 과정이 적절한지 외부 평가기관을 통해 평가를 받고 비식별 정보의 안전한 활용과 오남용 예방을 위해 사후 조치도 규정했다.

지난 3월 열린 빅데이터 애널리틱스 콘퍼런스. 출처 : 전자신문 DB
지난 3월 열린 빅데이터 애널리틱스 콘퍼런스. 출처 : 전자신문 DB

◇빅데이터 전망은

빅데이터는 활용도가 높은 만큼 많은 부가가치를 창출할 것으로 기대를 모으고 있다. 21세기의 석유라고 불리기도 한다.

시장조사업체 IDC는 빅데이터 시장이 2019년까지 연평균 23.1%씩 성장해 486억달러에 이를 것이라고 전망했다. 빅데이터 시장은 인프라·소프트웨어·서비스로 분류되며, 소프트웨어는 정보 관리 등을 위해 연평균 26%, 서비스는 22,7%, 서버와 스토리지 등 인프라 시장은 연평균 21.7%씩 성장할 것으로 예측됐다.

빅데이터 수집을 위한 센서, 데이터 연산을 위한 시스템반도체, 데이터 관리를 위한 소프트웨어와 정보 유출을 막기 위한 보안기술이 빅데이터 시대에 각광받는 기술이 될 것으로 전망된다.

문보경 자동차 전문기자 okmun@etnews.com