최근 수년 동안 인공지능(AI)은 크게 발전했다. 산·학 연계 연구개발자의 노력으로 알고리즘 수준은 향상됐고, 산업 현장에 적용된 사례도 증가했다. 제조, 품질 등 기업 내 여러 가치사슬 영역에서 그 효과가 입증되고 있어 기업에 AI는 사업을 혁신하고 미래 경쟁력을 좌우할 수 있는 핵심 요소가 됐다.
반면에 일반 소비자는 아직까지 일상에서 AI 기술 혜택을 크게 체험하지 못하고 있다. 2016년 알파고가 세계 정상급 바둑기사로부터 승리했을 때 많은 사람은 AI가 곧 가시적인 혜택을 우리 일상에서 보여 줄 것으로 기대했다. 하지만 아직 AI는 그 기대 수준에는 미치지 못하고 있다.
이처럼 AI에 대한 기대와 상용화 속도 간 차이를 보이는 원인은 무엇일까. 여러 원인을 들 수 있겠지만 기업 시각에선 컴퓨터 인프라 문제는 논외로 하고 크게 다음 세 가지 문제점을 꼽을 수 있다.
첫째 AI를 학습시킬 데이터의 준비와 확보에 어려움이 많다.
AI를 학습시키기 위해선 인간이 데이터에 일일이 정답을 표기하는 라벨링(Labeling) 작업을 해야 한다. 학습시킬 데이터가 많을수록, 라벨링 품질이 좋을수록 AI 성능 향상에는 도움이 된다. 그러나 이를 위해선 인간의 상당한 노동력과 시간 투입이 요구된다. 한 예로 자율주행 AI를 개발하기 위해선 최소 수십 시간의 주행 영상을 준비해서 학습시켜야 한다. 글로벌 컨설팅 기업 액센추어의 자료에 따르면 1시간 분량의 주행 영상을 라벨링하는데 약 800시간이 소요된다.
때로는 인간의 노동력과 시간을 투입한다 해도 확보 자체가 어려운 경우가 있다. 흔한 사례로 생산 공정에서 생산품 이미지 검사를 통해 불량을 검출하는 AI를 개발하는 경우 불량률이 높지 않은 공장이라면 학습시킬 불량 데이터가 충분하지 않은 제약이 있다.
둘째 개발된 알고리즘의 범용성과 설명 가능성(Explainability)이 부족하다.
'특정 문제 해결을 위한 AI'(Specific AI) 알고리즘을 또 다른 문제 해결에 활용하는 데는 제약이 따른다. 예를 들어 은행 예금 업무에 관한 데이터를 학습시킨 AI는 모바일 뱅킹 상담 챗봇으로 활용될 수 있다. 하지만 보험 상담 등 다른 영역에 적용하고자 할 때는 다시 개발해야 한다. 이와 같이 최적화한 하나의 알고리즘이 다른 용도에 활용되기 어려운 비범용성 문제로 말미암아 Specific AI의 개발 효율성이 낮을 수밖에 없는 어려움이 있다.
알고리즘을 통해 산출된 결과와 그 원인 변수 간 설명 가능성이 부족하다는 것, 즉 '설명할 수 없는 AI'(Unexplainable AI) 문제도 AI 적용 확대를 저해하는 주요 원인의 하나다. 한 예로 영업 마케팅 조직의 수요예측 AI가 미래구간 수요량을 예측해 낸다 해도 그 예측 근거가 연관 조직의 이해 당사자에게 명확하게 설명될 수 없다면 이 AI를 자재조달, 생산, 배송 계획에까지 연동시켜서 본격 적용하기란 어려울 것이다.
셋째 AI 전문 인력이 부족하다.
산·학·연에서 필요로 하는 전문 인력 수와 배출되는 인원수 간 차이는 더 벌어지고 있다. 기업에서는 AI 수요가 크게 증가하고 있는 데 반해 이 프로젝트를 진행할 역량 있는 전문 인력 수는 매우 부족한 실정이다. 전문 인력이 충분하다면 앞에서 언급한 데이터 준비 문제, 알고리즘의 비범용성 문제도 일정 부분 해결될 수 있겠지만 인력 부족 문제는 가까운 시일 안에는 해소되기 어려워 보인다.
이상과 같은 문제점을 개선하기 위해 진행되고 있는 기술 동향을 간략히 소개하면 다음과 같다.
첫째 학습시킬 데이터의 준비 및 확보 문제에 관해서는 △일일이 라벨링 작업을 할 필요 없이 AI를 활용해서 라벨링을 자동화하는 오토 라벨링 기술 △데이터를 생성하는 AI 기술로 부족한 학습 데이터를 인위적으로 만들어 내는 합성 데이터 기술 △일일이 정답을 제시해야 하는 지도 기반 학습 방식을 개선하기 위해 AI가 비지도 기반으로 데이터의 특징점을 스스로 학습하는 자기지도학습 △학습 데이터 가운데 성능 향상에 효과적인 것들만 선별해서 학습을 진행하는 능동 학습 연구가 활발하게 진행되고 있다.
둘째 알고리즘의 범용성 문제에 관해서는 이미 개발된 Specific AI 알고리즘을 일부 수정 후 소량의 데이터로 재학습시켜서 또 다른 용도의 Specific AI에 적용하는 전이 학습 연구가 이뤄지고 있다. 구글의 BERT, 미국 비영리 연구기관 오픈AI의 'GPT-2'와 같은 자연어 처리 모델에 전이 학습이 활용된다. 방대한 양의 학습 데이터를 미리 학습시켜서 생성된 언어 모델을 간단하게 조정해 번역, 요약, 질의 응답 등 다른 용도로 활용될 수 있다. 나아가 오픈AI가 2020년에 발표한 GPT-3에서 시작돼 최근 주요 AI 트렌드로 부각되고 있는 초거대 AI도 범용적 AI 가능성을 보여 준다.
LG그룹도 지난 12월 엑사원(EXAONE)이라는 초거대 AI 모델을 개발, 공개했다. 초거대 AI를 만들어 두면 새로운 용도마다 일일이 학습시키는 것이 아니라 샘플 예제 또는 가이드만으로도 Specific AI 확보가 가능하기 때문에 개발 효율성이 크게 높아질 수 있다.
설명 가능성 부족 문제에 관해서는 의료 및 금융 산업 등 AI가 산출한 결과의 신뢰성이 매우 중요한 산업 중심으로 알고리즘에 사용된 변수와 도출된 결과 간의 근거를 설명할 수 있는 AI가 주목받고 있다. 'Explainable AI' 기술은 기업과 고객, 사회 전반에 AI 성능에 대한 신뢰를 제공할 수 있기 때문에 꼭 필요한 연구 분야이다.
셋째 전문 인력 부족과 관련해선 전문 인력 의존도를 줄이기 위해 AI 개발 시 코딩 없이 프로그래밍하는 노 코드(No Code) 및 코딩 과정을 최소화하는 로 코드(Low Code) 도구, 학습 과정의 각 단계를 자동화하는 오토 머신러닝(AutoML)과 같은 기술이 개발되고 있다. ML Ops(Machine Learning Operations) 방법론도 일정 부분 대안으로 간주되고 있다. 이는 개발과 운영을 효율화해서 부족한 전문 인력의 활용 효율을 높여 보자는 것이다. 즉 Specific AI 개발과 운영 과정을 전문 인력에게 전적으로 의존하는 시각에서 벗어나 전 과정을 세부 단위별로 모듈화해서 워크플로화하는 것이다. 이를 위한 ML Ops 지원 플랫폼은 활발하게 시장에 등장하고 있다.
위와 같은 기술적 시도들을 통해 AI에 대한 기대와 상용화 속도 간 차이는 개선, 더 나아가 완전한 해결도 될 것이다. 하지만 일부 시도는 실제 적용까진 좀 더 시간이 필요할 것으로 전망된다. 단기간 내 모든 문제점의 개선과 해결은 어렵기 때문에 그 이전까진 현실적 대안으로 필자는 인간과 AI 간 협업을 바탕으로 한 최적(Optimized) 관점의 AI 지향을 제언하고 싶다.
이는 AI 기술의 현실과 한계를 인정하고 인간과 AI 간 협업, 즉 인간의 활동을 보조하고 인간의 역량을 증강하는 관점에서 AI 활용을 모색하는 것을 말한다. 이와 같은 관점 아래에서 인간과 AI 간 협업의 최적점을 찾는 것이 중요하다. 즉 특정 문제 해결을 위한 최소한의 AI 요구 수준, 해당 문제의 해결 프로세스 상에서 AI가 담당할 영역과 인간이 담당할 영역의 최적점을 찾는 접근이 현명한 방안이라 생각된다.
마지막으로 멀지 않아 AI 윤리는 AI가 활용되는 대다수 산업에서 주요 이슈로 떠오를 것이다. AI 윤리란 AI가 산출한 결과가 사회 규범에 위배되지 않도록 가이드라인을 논의하는 분야다. 한 예로 대인 충돌 사고가 불가피한 윤리적 딜레마 상황에서 자율주행 AI는 어떤 판단을 하도록 설계돼야 하는지, 미디어 산업에서 딥페이크 AI 기술은 풍자와 오락 요소로써 어느 수준까지 허용돼야 하는지와 같은 가이드라인이 논의되고 있다. AI를 활용하는 모든 기업은 올바르고 안전한 AI의 개발과 사용 측면에서 AI 윤리 또한 눈여겨보아야 할 때다.
이삼수 LG전자 최고디지털책임자(CDO, 부사장) sam.Lee@lge.com
<필자 소개>
이삼수 부사장은…
LG전자에 입사해 LG그룹 내 여러 계열사에서 경력을 쌓아 온 전략 전문가다. LG전자에서는 스마트비즈니스 전략, 기술전략, 사업전략 등 다양한 전략 분야를 담당했다. LG유플러스에서는 콘텐츠 및 서비스 사업을 담당했다. 2019년 LG그룹 최고디지털책임자(CDO), 그룹 융·복합 연구단지인 LG사이언스파크 대표를 역임했다. 2021년 LG전자로 복귀해 CDO로서 디지털 트랜스포메이션 가속화를 추진하고 있다.