지난 10년간 인공지능(AI) 기술의 수준이 급격히 증가하고 응용 분야 역시 급격히 팽창하고 있다. 현재 AI 기술의 주류는 신경망에 기반하고 있으며, 거대언어모델(LLM) 등의 등장으로 신경망 구동에 필요한 연산 수와 메모리 사용량은 기하급수적으로 증가하는 추세다. 높은 대역폭과 고용량의 메모리를 사용하는 그래픽처리장치(GPU)는 연산의 높은 병렬성으로 인해 중앙처리장치(CPU) 대비 신경망 구동에 소모되는 연산시간을 크게 줄일 수 있어, 현재 주류 AI 반도체로 위상을 공고히 하고 있다. GPU가 대규모 신경망 연산을 가능하게 하며, AI 연구자는 성능향상을 위해 더 큰 신경망을 요구하므로 더 많은 GPU 수요를 창출한다. 이 순환구조가 지속 가능한 전제 조건은 수요에 대응하는 공급 증가와 대량 생산에 따른 반도체 가격 하락이다. 하지만 현재 GPU 물량 부족, 급격한 가격 상승을 보면 지속가능성은 높지 않은 것으로 판단된다. 한때의 유행이 아닌 향후 수십 년 AI 기술의 지속적인 발전을 위해 AI 기술과 AI 반도체에 대해 심각한 고민이 필요한 시점이다.
우선 미봉책으로 GPU 시장의 불균형 해소가 있다. 현재 AI용 GPU 시장은 CUDA 프레임워크를 기반으로 한 엔비디아 독점체제다. 물량 부족의 대상은 일반 GPU가 아닌 엔비디아 GPU다. 시장 내 여러 제조사가 GPU 공급을 확대한다면 앞서 언급한 순환구조를 단기적으로 안정화할 수 있을 것으로 기대된다. 현재 개발된 수많은 AI 소프트웨어(SW) 라이브러리와의 호환성을 가지는 SW 프레임워크의 동시개발이 전제조건이다.
중단기적인 해결책은 AI 반도체 다양화다. GPU 일변도에서 벗어나 신경처리장치(NPU), 인메모리처리기(In-memory processor) 등의 등장으로 AI 반도체 공급이 확대되면 앞서 언급한 기술 발전 순환구조의 지속가능성을 개선할 가능성이 높다. 물론 이들에겐 높은 범용성과 기존 AI 라이브러리와의 호환성을 가지는 SW 프레임워크의 동시 개발이 요구된다. 특히 인메모리처리기는 연산기가 부착된 메모리 반도체로 LLM 구현에 필요한 매우 큰 메모리를 공급할 수 있는 AI 반도체다. 국내기업이 보유한 세계 최고 수준의 메모리반도체 기술을 십분 활용한다면 향후 개발 주도권을 확보할 수 있을 것으로 판단된다.
중장기적인 대책은 기존 신경망 대비 높은 연산·메모리사용 효율성을 갖는 신경망을 이용한 AI 구현과 이를 위한 AI 반도체 개발이 있다. 현재 주류 신경망은 신경망 내 층단위 신경정보처리에 필요한 연산이 많고 메모리 요구가 높아 많은 수의 고성능 GPU가 필요하다. 현재 주류 신경망을 높은 동작 효율성을 갖는 새로운 패러다임의 신경망으로 대체한다면 AI 기술 발전 지속성을 근본적으로 개선할 수 있다. 현재 선두 주자는 스파이킹신경망(SNN)이다. SNN은 뉴런 간 정보전달의 빈도가 낮아 연산의 희소성이 매우 높고, 정보전달 시 1비트의 최소정보량만을 사용해 연산에 필요한 메모리 사용량이 기존 신경망 대비 매우 낮다. 하지만 SNN의 높은 연산 효율성을 구현하려면 기존 AI 반도체와는 차별화되는 뉴로모픽 이벤트 프로세서가 필요하다. 뉴로모픽 이벤트 프로세서는 뉴런에서 이벤트('1')가 발생 시 순차적으로 처리하며, 이벤트가 발생하지 않을시('0') 연산 동작을 수행하지 않는다. '0'과 '1'의 여부와 상관없이 연산을 수행하는 기존 AI 반도체와 달리 연산의 효율성이 크게 증가해 전력 소모가 적고 연산시간이 매우 짧은 장점이 있다. 뉴로모픽 이벤트 프로세서 기반 AI 기술의 발전을 위해 본 기술의 저변확대가 필요하며, 이를 위해 하드웨어(HW)뿐 아니라 스파이킹신경망 기반 AI 기술 개발 시 사용자의 높은 편의성을 제공하는 라이브러리 등 SW 기술의 동시 개발이 요구된다.
정두석 한양대 신소재공학부 교수 dooseokj@hanyang.ac.kr