[사설]'외화내빈' 데이터 걱정스럽다

[사설]'외화내빈' 데이터 걱정스럽다

정부 데이터가 질적으로 크게 떨어진다는 보고서가 나왔다. 국회 입법조사처는 최근 발간한 '디지털 시대를 위한 D·N·A 정책 현황과 과제' 보고서에서 정부 주도로 데이터 목록은 많이 쌓였지만 실제 사용할 만한 데이터는 부족하다고 밝혔다. 이 때문에 '디지털 뉴딜' 사업도 겉돌 가능성이 있다고 비판했다. 디지털 뉴딜은 인공지능(AI)과 소프트웨어(SW) 인재 양성, 데이터댐 구축, 빅데이터 플랫폼 설립 등 사업이 골자다. 정부는 데이터댐 조성을 위해 AI를 학습시키는 학습용 데이터를 구축하고 있다. 오는 2025년까지 1300종의 학습용 데이터를 구축하고, 이를 AI 허브를 통해 개방할 계획이다.

보고서는 “데이터 공급·유통 정책은 양질의 데이터를 전제로 하지만 실제 우리 사회에 좋은 데이터가 많지 않은 것이 문제”라고 꼬집었다. 특히 데이터 공급·개방을 강요하고 실적에 치중하기보다는 디지털 시대에 필요한 데이터가 무엇인지와 어떻게 데이터를 확보하고 품질을 높일 수 있는지 논의해야 한다고 강조했다. 결론적으로 정부가 데이터 수집에 나서면 수요자 부담을 줄여 주는 장점이 있지만 궁극적으로 시장 형성에 부정적인 영향을 미치고, 데이터 생태계를 교란할 수 있다고 우려했다. 일부 주장은 다소 침소봉대가 있지만 새겨 들을 부분도 있다. 과도한 정부 개입이 오히려 생태계에 악영향을 미친다는 부분이다.

데이터는 AI의 원료와 같다. 원재료 수준에 따라 결과도 달라질 수밖에 없다. 데이터 수준이 진주인지 쓰레기인지에 따라 나오는 결과물도 '180도' 달라진다. 음식도 재료에 따라 맛이 결정된다. 상식적으로 수준 높은 성과는 정제된 데이터에서 나온다. 그동안 국내에서는 많은 데이터를 모으는 데 집중했다. 데이터가 절대적으로 부족한 상황에서 나쁘지 않은 전략이다. 데이터도 많을수록 결과치가 더 정확해지는 법이다. 나아가 이제는 데이터 품질에도 신경을 써야 한다. 특히 공급자가 아니라 수요자 중심에서 양질의 데이터를 확보해야 한다. 무조건 데이터를 모으고 개방하겠다는 공급자 중심에서 시장 수요자를 감안한 데이터 정책이 필요한 시점이다. 데이터 정책도 업그레이드가 필요하다.