[KISTI 과학향기]스마트폰이 비서로 진화한다?

[KISTI 과학향기]스마트폰이 비서로 진화한다?

기계와 대화를 나누는 일은 이제 낯설지 않다. 보험이나 카드회사처럼 고객문의가 많은 회사와의 통화는 예외 없이 기계음을 듣는 것으로 시작한다. ‘*번을 누르세요’라는 반복을 참고 나면, ‘다시 들으려면 # 버튼을 누르세요’로 끝나는 지루한 경험이 대부분이지만.

영화라면 다르다. 기계, 아니 시스템과 ‘말’로 소통하는 일은 SF영화에서 흔한 설정이지만, 늘 극적이다.

‘2001스페이스 오디세이’의 ‘할’, ‘터미네이터’에서 인류 말살을 지시하는 ‘스카이넷’, ‘아이언맨’에서 슈퍼히어로를 돕는 만능 비서 ‘자비스’, ‘그녀’에서 주인공을 사랑에 빠지게 한 ‘사만다’까지. 그들은 무시무시한 판단력과 그보다 더 파괴적인 실행력으로 전 인류의 운명을 좌지우지하고, 사용자 능력을 인간 이상으로 만들며, 사람 마음을 움직여 사랑에 빠지게 한다.

현실에서도 할이나 자비스, 사만다가 가능할까? 최근 ‘모바일 지능형 비서’ 서비스들이 속속 출시되며 기대가 높아지고 있다.

애플의 ‘시리’, 구글의 ‘구글나우’, 마이크로소프트의 ‘코타나’, 페이스북 ‘M’을 비롯해 삼성 ‘S보이스’, 바이두의 ‘두 시크리터리’ 등 세계 주요 IT기업이 뜨겁게 앞다퉈 서비스를 출시하고 이 새로운 비서를 써보라 부추기고 있다.

시작은 애플의 ‘시리’다. 2011년 아이폰 4S에 탑재된 시리는 음성으로 명령을 내리면 검색을 하거나 앱을 실행하는 반응을 보인다. 전화번호를 찾아서 전화를 걸게하거나, 말로 불러주면 SNS나 메일에 글을 쓰게 할 수 있다. 미리 등록된 약속을 알려주거나 쇼핑 목록을 만드는 등 간단한 비서 업무를 처리할 수 있다.

처음 서비스를 시작할 때 시리는 ‘장난감’ 취급을 받았다. 물어보면 뭐든 대답은 하는데 도통 말귀를 못 알아채는 답답한 친구랄까. 하지만 은근슬쩍 농담을 던지는 인간미가 있어, 기계와 대화하는 거부감이 덜 하다는 게 강점이다.

“잘 잤어?”라고 물으면 “저는 쉬지 않아요. 하지만 물어봐 주셔서 감사합니다”라고 대답한다거나, “따뜻한 말 한 마디 해봐”라고 청하면 “저는 벌써 감동받아서 프로세서에 열이 나기 시작하는군요”라는 기계식 농담으로 응수한다. 애플은 스웰, 톱시, 보컬IQ, 퍼셉티코 등 인공지능(AI) 기술을 가진 업체들을 인수해 시리의 능력을 끌어올리려 하고 있다.

시리가 명령에 반응한다면, 구글의 ‘구글 나우’는 사용자의 패턴을 학습해서 의도를 알아채고 미리 정보를 전달하는 적극적인 비서다. 집과 회사처럼 자주 방문하는 곳으로 가는 길의 교통 정보를 알려준다거나 공항에 있다면 환율 정보를 제공하는 식이다.

글자를 입력하면 더 정확한 결과를 얻을 수 있음에도 말귀를 못 알아듣는 답답한 비서에게 말하는 서비스에 왜 주목할까? 음성은 인간에게 글자보다 더 쉽고 간단한 도구다. 무엇보다 손이 자유로워지므로 이동하거나 다른 활동을 하면서도 얼마든지 이용할 수 있다.

설거지를 하면서 동네의 미세먼지 농도를 확인하고 쇼핑을 할 수 있다. IoT(사물인터넷) 환경이라면 음성으로 세탁기와 로봇청소기를 작동시킬 수도 있다. 운전을 하고 있어 손을 쓸 수 없을 때, 시력이 약하거나 손을 사용하기 어려운 노약자, 글자를 모르는 어린아이에게도 쓸 수 있다는 강점이 있다. 다쳤거나 위급한 상황에서도 유용하다.

미국에선 트럭에 깔린 소년이 시리로 911을 불러 구조된 일도 있다. 또 스마트워치나 웨어러블 기기들처럼 스크린이 작거나 없어 입력기기를 따로 두기 힘든 소형기기에는 필수적인 장치다. 그러므로 음성과 몸짓을 이용한 검색이 ‘대세’가 될 것이라는 예측이 나온다.

그렇다면 음성인식 기술의 발전 정도는 어떤가? 몇 년 전만 해도 음성 인식 분야는 잿빛이었다. 국내의 경우 새로 이 분야를 연구하려는 전공자도 찾아보기 힘들 정도였다. 하지만 시리 등장과 인식 네트워크 기술의 개발, 딥러닝(빅데이터와 알고리즘을 이용해 컴퓨터가 스스로 학습, 응용하는 기술) 등은 음성인식에 새 날개를 달아 주고 있다.

내 휴대기기 안에 있는 정보를 이용해 일정을 관리하고 사진을 찍고, 정보를 검색하는 단순한 업무 외에 인간에게는 복잡하고 어려운 일을 거뜬히 해낼 수 있다. 통역 서비스가 대표적인 예다. 구글의 래리 페이지는 동시통역 기능이 “2017년이면 64개 언어로 자유롭게 소통 가능한 수준으로 발전할 것”이라고 밝힌 바 있다. 자동 통〃번역 솔루션 회사 시스트란 멀티모달실 이상운 실장은 “이미 동시통역사가 대화를 실시간으로 통역하는 것과 같은 수준으로 구현 가능하다”고 밝혔다.

여행은 물론이고 해외 직구로 미국이나 독일, 프랑스 회사의 고객센터와 전화할 일이 생겨도 휴대전화 속 통역 앱을 이용하면 난처할 일이 없다.

기술은 이미 완성형이지만 사용자가 느끼기엔 여전히 어색하다. 영화 속 아이언맨 자비스를 가능하게 해줄 열쇠는 인간이 쥐고 있다. 더 많이 쓰고, 더 오래 써서 데이터를 쌓으면 시스템은 그 데이터를 이용해 학습한다. 결국 데이터를 얼마나 축적하는지가 관건이다. 똑똑한 ‘시리’와 ‘구글 나우’는 아이폰으로 통화하고, 구글로 검색하는 전 세계의 모든 사람의 정보가 데이터가 될 수 있다. 단 하나뿐인 나의 비서는 사실 우리 모두이며 수많은 인간 행동이 쌓은 데이터의 결과물인 것이다.

휴대전화 속 비서 기능이 아무리 발전해도 사람들이 느끼는 정서적인 거부감은 꽤 지속될 수 있다. 여러 사람이 모인 곳에서 시스템과 대화를 하는 일이 불편하게 여겨질 수 있다. 하지만 영원하진 않을 거다. 전화가 처음 세상에 나왔을 때 선 너머에 있는 사람과 대화하는 일이 도무지 낯설고 믿기지 않았던 것처럼.

지금은 물어보는 것에 대답할 줄 아는 것만으로도 기특하지만, 앞으로는 나도 모르는 내 마음을 읽어 내가 궁금해 할 것을 미리 알려주고 주변기기를 작동해 내가 해야 할 일을 처리하고 보고만 하는 그런 비서가 모두의 옆에 있게 될 것이다. 100% 기억력에 유머와 감성까지 겸비한 탁월한 비서 말이다.

하지만 그 때에 우리는 영희에게 전화를 걸면, 영희의 비서와 통화하게 되는 일을 겪을 수 있다. 진짜 당혹스런 일은 우리가 진짜 영희와 통화했는지, 영희의 지능형 비서와 통화했는지 구분하지 못할 수 있다는 점. 그때 우리도 영화 ‘그녀’의 주인공 테오도르처럼 휴대전화 속 목소리에 물어야겠다. “당신을 뭐라고 부르면 되죠?”

이소영 과학칼럼니스트