광주과학기술원(GIST·총장 김기선)은 이규빈 융합기술학제학부 교수팀이 계층적 가림 모델링으로 복잡한 로봇 환경에서도 미학습 물체 가시 영역과 비가시 영역, 가림 여부를 동시에 검출하는 딥러닝 기술을 개발했다고 16일 밝혔다.
로봇이 새로운 환경에서 물체를 조작하려면 사전에 학습하지 않은 새로운 물체가 주어지더라도 이를 정확히 검출할 필요가 있다. 이미지로부터 객체별 영역을 검출하는 인스턴스 분할은 딥러닝 및 로봇 비전의 핵심 연구 분야다. 하지만 사전에 학습한 범주의 물체만 인식할 수 있거나 미학습 물체의 가시 영역만을 검출할 수 있다는 한계를 갖고 있다.
연구팀은 로봇이 미학습 물체 가시 영역뿐만 아니라 가려진 영역과 가려짐 여부도 동시에 검출하는 것을 목표로 연구에 착수했다. 미학습 물체의 아모달 인스턴스 분할을 통해 물체 간 가림 관계를 효과적으로 고려하기 위한 계층적 가림 모델링을 제안했다. 이를 학습 및 평가하기 위한 새로운 가상 및 실 환경 데이터셋도 공개했다.
연구팀이 제안한 알고리즘은 3개 데이터셋에서 세계 최고 수준의 성능을 달성해 복잡한 환경에서의 로봇 인식 성능을 크게 높일 수 있다. 로봇이 가려진 목표 물체를 파지(손에 쥠)하는 데 활용해 실제 로봇의 다양한 작업에 활용될 수 있다는 사실을 규명했다.
이규빈 교수는 “복잡한 비정형 환경에서 새로운 물체가 주어져도 물체의 보이는 영역뿐만 아니라 가려진 영역까지 인식할 수 있음을 확인했다”며 “미학습 물체 인식은 공장, 가정 등 다양한 환경에 로봇을 적용하기 위한 로봇 분야의 핵심기술로 활용할 수 있을 것으로 기대한다”고 말했다.
이 교수팀이 수행한 이번 연구는 산업통상자원부 로봇산업핵심기술개발사업 재원 지원과 과학기술정보통신부 및 정보통신산업진흥원의 국가 AI 데이터센터 서비스 및 고성능 컴퓨팅 자원 지원 사업의 컴퓨팅 연산 지원을 받아 이뤄졌다. 연구에 사용된 코드와 데이터셋은 오픈소스 저장소에서 다운로드할 수 있다.
백승혁 박사과정생이 제1저자로 참여한 이번 연구는 미학습 물체 인식 분야에서 세계 최고 수준의 성능을 달성해 삼성휴먼테크논문대상에서 동상을 수상했다. 세계 최고 권위의 로봇학회인 로봇자동화학회(ICRA)에서 발표할 예정이다.
광주=김한식기자 hskim@etnews.com