반도체는 상황에 따라 전기적인 신호를 가하면 전류가 잘 흐르거나(도체), 잘 흐르지 않게(반도체) 할 수 있다. 이러한 반도체의 특성을 활용한 컴퓨터, 냉장고, 세탁기, 자동차 엔진컨트롤유닛(ECU), 스마트폰 등 일상의 많은 전자기기가 인간의 삶을 보다 더 윤택하게 만들어 가고 있다.
챗GPT와 같은 인공지능(AI)에도 산술연산에 특화된 중앙처리장치(CPU)와 병렬연산에 특화된 그래픽처리장치(GPU) 같은 반도체가 많이 사용되고 있다. CPU는 컴퓨터에서 산술연산을 매우 빠른 속도로 처리할 수 있는 특징이 있지만, GPU보다 코어(데이터 처리 단위) 수가 적기 때문에 병렬처리에는 한계가 있다. 반면 GPU는 게임과 그래픽처리용으로 개발됐고, 픽셀 단위 처리를 하기 위해 많은 수의 코어를 보유하고 있어 병렬 처리에 뛰어난 성능을 보인다. GPU가 존재하지 않았다면, 인공신경망을 구성해 학습하는 딥러닝 모델은 오늘날 생성형 AI로 진화하기 어려웠을 것이다.
최근에는 오픈AI를 통해 챗GPT가 전세계적으로 대중화되면서, 챗GPT와 같은 대규모 언어 모델(LLM)의 종류 또한 다양하게 증가하고 있다. 하지만 그 이면에는 과도한 전력 사용 이슈가 있다. 챗GPT-3의 경우 데이터 학습을 위해 45TB의 빅데이터가 사용됐는데, 이처럼 엄청난 양의 데이터 수집·처리에는 많은 비용이 발생할 수 밖에 없다.
현재 시장에서, CPU는 인텔과 AMD, GPU는 앤비디아, 메모리는 삼성과 SK하이닉스가 세계 주도권을 형성해 나가고 있다. 이러한 글로벌 빅테크기업들은 비용 절감과 성능 향상이라는 난제를 해결하기 위해 대규모 투자를 진행하고 있고 최신 기술 개발에도 총력을 다하고 있다.
전통적 CPU 방식의 폰 노이만(Von Neumann) 구조는 CPU와 메모리가 분리돼 있어 메모리에 저장돼 있는 연산자와 관련 명령어들을 CPU로 불러와 연산을 수행하기 때문에 입출력 신호가 발생한다. 이에 따라 연산량이 많아질수록 입출력 신호도 많아져, 연산속도보다 입출력 속도로 인한 성능 저하 병목현상이 발생한다. 이는 AI의 학습에 필요한 연산 성능에 영향을 줄 수 밖에 없다.
이런 부분을 보완한 차세대 반도체 프로세싱인메모리(PIM) 기술은 메모리와 연산을 한 곳에서 수행함으로써 데이터 이동을 최소화하고, 연산속도를 대폭 향상시키는 역할을 한다. 메모리 성능과 관련된 외부 입출력 없이 메모리가 연산 기능까지 수행하도록 해, 외부 입출력에 소요되는 성능 이슈를 해결할 수 있으며, 상대적으로 전력 소모도 줄일 수 있는 장점을 가지고 있다.
최근 정부에서도 AI 혁신 펀드를 조성해 PIM AI 반도체 핵심원천 기술 확보를 위해 2028년까지 총 사업비 4027억원을 투자하겠다는 계획을 발표했다. 향후 PIM 반도체가 상용화되면 산업 전반에 특화된 AI 기반 반도체를 적용해, 보다 높은 생산성 향상과 더불어 인류의 삶은 더욱더 진화하고 목적에 특화된 AI가 장착된 휴머노이드와 같은 고부가가치 제품들의 확대로 이어질 것이다.
반도체와 AI가 주도하는 미래는 분명 지금과는 확연히 다를 것이다. 이 시대를 사는 우리는 어떤 미래를 상상하고 어떤 준비를 해야 될지 사뭇 궁금증이 든다.
장문수 한국폴리텍대학 반도체융합캠퍼스 반도체장비소프트웨어과 교수 avecmschang@kopo.ac.kr