[ICT시사용어]기계독해

@게티이미지뱅크
@게티이미지뱅크

기계독해는 인공지능(AI) 알고리즘이 스스로 문제를 분석하고 질문에 최적화된 답안을 찾아내는 기술을 말한다.

사람이 텍스트를 읽고 질문 답변을 추론하듯이 AI가 문장 속에서 의미를 찾고 답변할 수 있다. 추론은 불가능하지만 사람이 관련 정보를 찾기 위해 정보를 일일이 확인하지 않아도 답을 찾아낼 수 있다.

과거 기계독해는 알고리즘을 일일이 컴퓨터에 주입하는 방식으로 이뤄졌다. 알고리즘은 규칙 다발이다. 사람은 무의식적으로 하는 일을 기계에게 차례로 수행하도록 규칙 명령을 내려야 했다. 수많은 규칙을 일일이 입력하는 것은 매우 어렵고 효율이 떨어진다.

언어는 본질적으로 앞뒤가 딱 맞아떨어지는 영역이 아니다. 문법을 벗어난 표현이 일상적으로 사용되기도 하고 문맥에 따라 다른 의미로 이해되는 경우도 있다. 알고리즘을 입력하는데 한계가 존재할 수밖에 없다.

이를 해결하기 위해 데이터베이스를 학습하는 AI가 등장했다. 글자와 단어, 문장을 숫자형태로 인식해 독해하는 '인간의 방식'으로 접근한다.

컴퓨터는 글자 하나하나를 벡터로 인식하고 처리한다. 이렇게 이해하는 방식을 자연어 이해방식이라고 한다. 기계적으로 분석해 컴퓨터가 이해할 수 있는 형태로 만들거나 컴퓨터가 이해하도록 만들어진 형태를 다시 인간이 이해할 수 있는 언어로 표현하는 기술이다.

최근 기계독해는 글로벌 챌린지 대회가 개최되고 있다. 거의 대부분 딥러닝 기술을 적용한 솔루션이 상위권을 차지하고 있다. 글자와 이미지를 인식·분석하는 컴퓨터 비전(VISION), 광학문자인식(OCR) 기술 고도화를 추진 중이다.

향후 질의응답 기술을 기반으로 전문가 수준의 의사결정지원 시스템이 개발될 수 있을 것으로 예측된다. 여기에는 딥러닝, 추론 등 인공지능 기술이 활용될 예정이다.

이현수기자 hsool@etnews.com