BBC, 로봇이용해 일기예보 한다

英과학자들, 기계학습 ‘딜리전트’ 프로젝트 가동

컴퓨터가 인간처럼 기상정보 데이터를 처리해 일기예보를 업데이트해 주는 시대가 임박했다.

데일리메일은 4일 BBC가 연내 로봇을 이용한 일기예보를 하게 될 전망이라고 보도했다.

이에 따르면 BBC방송은 연내 컴퓨터 자연어처리(NLP)방식으로 생성된 기상예보 업데이트를 하게 된다.

이미 영국과학자들은 메타오피스데이터를 사용해 자동적으로 상세한 기상예보를 만들어 내는 새로운 알고리즘 개발작업을 진행중이다.

이 로봇기상예보 프로젝트는 ‘도메인에 독립적인 언어 발생기’라는 의미를 가지는 딜리전트(DILiGENt)로 명명됐다. 베리나 리저 헤리엇와트대 수학컴퓨터과학과 교수, 안드레아스 블라코스,세바스찬 리델 런던컴퓨터과학과 교수가 이 프로젝트를 이끌고 있다.

이들은 프로젝트가 성공적인 것으로 나타나면 올해 말 BBC웹사이트를 통해 지역 일기예보부터 시험방송할 예정이다. 현재 BBC웹사이트는 기상전문가들이 작성한 10개의 보도를 내보내고 있다. 이들 기상예보는 영국의 광범위한 지역을 다루고 있다. 하지만 2만개 이상의 개별지역에 대한 자세한 개별 기상예보를 필요로 하고 있다.

컴퓨터가 인간처럼 기상정보 데이터를 처리해 일기예보를 업데이트해 주는 시대가 임박했다. BBC가 연내 로봇을 이용한 일기예보를 하게 될 전망이다. 사진=BBC동영상
컴퓨터가 인간처럼 기상정보 데이터를 처리해 일기예보를 업데이트해 주는 시대가 임박했다. BBC가 연내 로봇을 이용한 일기예보를 하게 될 전망이다. 사진=BBC동영상

이 프로젝트 참가자인 리저 박사는 “자연어처리(Natural Language Processing,NLP)를 위한 기계학습이 딜리전트의 모든 것”이라고 말한다.

자연언어생성기(Natural Language Generator,NLG)는 컴퓨터상에서 자동적으로 영어, 또는 다른언어를 만들어내는 처리 과정을 담당한다. 통상적으로 이 프로그램은 통계와 숫자, 또는 언어로 쓰여지지 않은 모든 정보를 가지고 작업을 시작한다. 여기에는 숫자데이터 또는 데이터베이스에 입력된 정보들이 포함된다. NLG는 기상예보 텍스트들을 더 읽기 쉽고 이해하기 문장을 바꾸어 말하게 해준다.

컴퓨터언어를 자연어로 바꾸는 기기인 컴퓨터변환기는 흔히 음성의 높낮이와 문법상 문제로 인해 거슬려 왔다. MS,아마존, 야후 같은 거대회사는 이 분야에 실질적인 새로운 투자를 하고 있으며 신생기업들도 나타나고 있다.

한편 미국기업 내러티브 사이언스는 30초에 기사 하나를 작성해 주는 알고리즘을 개발, 미경제잡지 포브스에 기업 분기실적 예상 및 주가 기사를 작성해 주고 있다. LA타임스도 지난 해 로봇이 작성한 지진 속보 기사를 내보내 주목을 받았다. 로봇이 작성한 기사는 데이터 수집, 분석,통계지표를 바탕으로 한 뉴스 찾아내기, 기사주제확정, 데이터베이스에 기반한 세부 기사 배열, 자연어 기사작성 단계 등을 거치게 된다.

전자신문인터넷 이재구국제과학전문기자 jklee@etnews.com