“도서관은 4차 산업혁명 시대 데이터의 보고입니다.”
남영준 중앙대 문헌정보학과 교수는 인공지능(AI)에서 가장 중요한 데이터는 도서관에 있다고 강조했다.
남 교수는 “구글홈 등 AI 채팅봇이 인간과 대화하기 위해서는 문장 속 숨겨진 의미를 파악해야 한다”며 “예를 들어 상인이 '밑지고 팝니다'란 문장을 곧이곧대로 받아들이면 인간과 대화가 이어질 수 없다”고 설명했다. AI가 대화 앞뒤 상황을 분석한 뒤, 상인이 판매에 대한 강한 의지를 담아 말한다고 판단해야 한다고 덧붙였다.
그는 “책에는 인간의 희로애락과 생로병사가 모두 들어있다”며 “책에 있는 대화체 문장과 상황인지정보가 더해지면 AI 지식이 급속도로 진화할 수 있다”고 말했다.
다른 분야보다 도서 분야 데이터 수집·분석이 가장 용이하다는 게 남 교수 생각이다. 그는 “AI가 발전하기 위해서는 데이터를 많이 수집해야 하는데 헬스, 금융 분야는 개인정보보호 정책 때문에 데이터를 얻는데 어려움이 많다”고 지적했다. 반면 도서 분야는 제약이 적어 수많은 데이터를 수집할 수 있다고 피력했다.
남 교수는 의학과 종교 도서의 연관성을 예로 들었다. 그는 “보통 종교학 도서는 도서관에서 수요가 적다고 생각하는데 의외로 대출이 많았다”며 “데이터를 수집, 결합하니 의대생이 의학 윤리, 안락사에 대한 많은 책을 읽는 것을 알게 됐다”고 전했다.
도서 속 데이터의 중요성도 강조했다. “과거에는 책을 봤다면 이제는 도서 속 정보를 수집, 결합한 데이터를 봐야 한다”는 것이다.
도서관 역할도 자연스레 확대된다. 남 교수는 “빅데이터 분석도 중요하지만, 적절한 데이터를 수집한 뒤 결합시키는 작업이 선행돼야 한다”고 했다. 이어 “지금 산업계가 데이터 분석에 초점을 맞추고 있지만 어떤 현상을 파악하기 위해 어떤 데이터가 최적인지에 대한 논의는 심도 있게 진행되지 않는다”고 아쉬움을 토로했다.
그는 “많은 데이터가 어디에 있는지, 어떤 조건으로 획득할 수 있는지에 대한 체계적인 서비스를 받기 위해서는 데이터 관리 전문가가 필요하다”면서 “연구자나 개발자는 데이터를 해석하고, 도서관과 사서가 최적의 데이터를 수집·추천하고 쓰기 좋게 병합하는 역할을 할 수 있다“고 설명했다.
남 교수는 한국정보관리학회장, 공공데이터전략위윈회 위원, 국가DB심의위원회 위원장 등을 역임하고 현재 국가정책정보협의회장 등으로 활동 중이다.
그는 “도서관은 기본적으로 모든 정보자원을 다룬다”면서 “앞으로는 데이터를 중요 정보자원의 반열에 올려놓고, 데이터 수집·병합·해석 등에 대한 종합 서비스를 제공해야 한다”고 도서관의 변화상을 그렸다.
전지연기자 now21@etnews.com