마블 영화 아이언맨에 나오는 토니 스타크의 인공지능(AI) 집사 자비스(JARVIS:Just A Rather Very Intelligent System)가 드디어 초거대 AI 모습으로 현실에 등장했다. 미국 오픈AI는 2020년 6월 초거대 AI인 GPT-3을 출시했는데, 지난해 11월 말 GPT-3의 여러 오류를 개선한 GPT-3.5 버전 '챗GPT'를 공개했다.
챗 GPT는 인간과 자연스럽게 대화가 가능해 공개 5일 만에 사용자 수가 100만명을 넘어섰다. 깃허브(GitHub) 코파일럿(Copilot)과 오픈 AI의 DALL·E2가 100만명 사용자를 확보하는 데 각각 6개월과 2.5개월이 걸렸다는 점을 고려하면 챗 GPT 확산속도는 전례가 없다.
챗GPT는 논리적이면서 상세한 일상대화가 가능하고 어려운 질문에도 답을 제시하거나 장문의 글을 요약해준다. 심지어 주제어를 제시하면 시나 소설을 창작하고, 코딩도 전문가급 실력을 발휘하는 수준이다.
◇챗GPT, 검색엔진 시장에 도전
구글은 글로벌 AI 기술을 선도하고 있으나 최근 챗GPT 급부상과 마이크로소프트 등 관련 업계 도전에 긴장하는 모습이다. 순다르 피차이 구글 CEO는 연초 내부 AI 전략회의에서 챗GPT가 검색엔진 사업에 미치는 위협을 해결하라는 지시를 내리기까지 했다.
구글 검색엔진은 사용자가 입력한 검색어와 연관성이 높은 정보링크를 보여주고 해당 링크에 사용자가 직접 클릭해서 정보를 찾는 방식이다. 반면 챗GPT는 학습된 정보를 바탕으로 마치 전문가에게 상담받듯이 요청하는 고급정보를 찾아주고 요약이나 여러 대안 중에서 가장 적절한 답을 빠르게 제시해준다.
챗GPT는 필요한 정보를 검색하고 판단하는 시간을 획기적으로 줄여준다는 점에서 구글이 야후를 도태시켰던 것처럼 검색시장 판도 변화를 불러올 수 있다고 전문가들은 전망한다. 챗GPT 스스로도 “검색엔진 시장에 미칠 영향을 정확히 예측하기는 어렵지만, 챗GPT는 사용자에게 더 정확하고 자연스러운 언어처리를 제공해 검색 결과를 개선할 수 있다. 또 자연언어 질의 이해와 더 정확한 질의 제안 같은 좀 더 고급 검색기능을 만들 수 있다”고 자신만만하게 답한다.
◇전문적인 논문 작성까지 하는 챗GPT
최근 미국 노스웨스턴대 연구에 따르면 챗GPT가 쓴 초록은 표절 검사도 손쉽게 통과했다. 챗GPT가 작성한 초록에 대해 AI 저작물 검사 프로그램이나 전문가들도 3편 가운데 1편은 실제 사람이 작성했다고 판정할 정도니 과학계는 적잖은 충격을 받은 모양새다.
영국 옥스퍼드대 샌드라 와처 교수는 '네이처'에 “과학 연구는 사회에 큰 영향을 준다”며 “과학자들의 연구가 진짜인지 판단할 수 없다면 무서운 결과를 가져올 수 있다”고 지적했다.
챗GPT는 이미 과학논문 작성에 활용되고 있는 것으로 알려졌다. 지난달 공개한 스페인 연구자들은 신약 개발 분야 AI 역할을 다룬 논문에서 챗GPT를 세 번째 공저자로 올렸다. 영국 맨체스터대 오코너 교수는 국제학술지에 발표한 논문에서 자신과 챗GPT를 공동 교신저자로 등재했다. 또 홍콩 과학기술파크의 면역억제제 관련 연구논문은 챗GPT를 주저자로 기재해 펍메드(PubMed)에 공개되기까지 했다. 유튜브에는 이미 챗GPT를 활용한 연구논문 쓰기 강의까지 올라와 있다. 이와 같은 소식에 정부출연연구기관(출연연) 연구원들은 놀라움과 함께 자신의 논문을 테스트 해보기까지 했다고 여럿이 소셜네트워크서비스(SNS)에 반응을 올렸다.
◇ 코딩에 자신 있는 챗GPT
실제로 시험해보니 챗GPT는 코딩 한 줄 안하고 파이선, C++, 자바(Java), 오래된 포트란 등 다양한 프로그램 언어로 투자 애플리케이션(앱)이며 통계분석, 게임 등 프로그램 코딩을 일사천리로 만들어준다. 사람이 코딩한 프로그램이 오류가 없는지 검사도 해주고 심지어 수정까지 하는 전문가 수준에 다시 한번 놀라게 된다.
일반인들도 쉽게 챗GPT를 활용해 로코드-노코드(Low code-No code) 방식으로 다양한 애플리케이션을 만들 수 있다. 전문가들도 다른 프로그램으로 코드를 전환해야 하거나 오류검증을 해야 할 때, 갑자기 코드가 생각나지 않을 때 등 여러 상황에 사용할 수 있다. 사실 프로그램 코딩은 데이터 전처리도 필요 없고 함수 목적과 쓰임이 명확해 챗GPT 입장에서는 학습이 수월했을 것이다.
◇올해 멀티모달 GPT-4 등장 기대
포브스는 2023년 AI 업계 10대 예측에서 첫 번째로 GPT-4 등장을 꼽았다. GPT-3은 1750억 개의 매개변수를 갖고 학습하고 추론하는 능력을 가졌는데, GPT-4는 매개변수가 100조개가 될 것이라고 하니 그 성능이 더욱 기대된다. GPT-4 등장으로 텍스트에서 이미지, 오디오 등 멀티모달 데이터 입력과 학습이 가능해진다면 마치 인간이 정보를 받아들이고 두뇌가 사고하는 방식과 거의 동일한 수준까지 발전할 것이다.
분명 현재의 챗GPT는 여러 한계가 있다. 학습한 내용에 오류나 편향된 정보가 있으면 잘못된 답을 내놓을 수 있다. AI 특성상 학습에 오랜 시간이 걸려 최신정보로 바로 반영되지는 못한다. 또한 거짓 정보를 마치 사실인 것처럼 그럴듯하게 꾸며내는 악용 가능성도 배제할 수 없다. 그럼에도 챗GPT 한계를 넘어 활용을 잘만 한다면 그 가치는 무궁무진할 것이다.
영화 아이언맨의 자비스처럼 사람이 말만 하면 알아서 복잡한 문제를 해결해주는 시대가 이미 우리 일상에 몰려오고 있다. 창의적인 일 만큼은 AI가 아무리 발전해도 인간의 경험이 더 중요하다고 생각해왔는데, 이제부터는 창의적인 문제도 AI와 협업해 가치를 창출하는 'AI 창의력 엔진(AI Creativity Engine)' 시대에 대비해야 하지 않을까.
글 : 조일구 정보통신기획평가원(IITP) 수석
-
김영준 기자기사 더보기