“AI 모델 경량화 기술이 AI 반도체 칩 차별화 '핵심 열쇠'”

Photo Image
15일 서울 리버사이드호텔에서 개최된 제 2회 인공지능 반도체 포럼 조찬강연회에서 이동수 네이버클라우드 이사가 '초거대 AI를 위한 AI 반도체'를 주제로 발표했다.

'인공지능(AI) 모델 경량화' 기술이 차세대 인공지능(AI) 반도체 칩 역량을 좌우할 핵심 경쟁력으로 부상할 전망이다. 단순 AI 연산과 추론 성능만으로는 AI 반도체 칩 시장에서 차별화하기 어렵다는 지적이다. AI 반도체 시장 승기를 잡으려면 고성능·저전력 메모리와 인터페이스 기술도 필요하다는 것이 전문가 분석이다.

이동수 네이버클라우드 이사는 15일 열린 'AI 반도체 포럼 조찬강연회'에서 AI 반도체 기술이 나아가야할 방향을 제시했다. 이 이사는 IBM·삼성리서치에서 AI와 관련 반도체를 연구한 전문가로, 2021년부터 네이버에서 거대 모델 최적화와 AI 반도체 전략, AI 반도체 공동 개발 등을 담당하고 있다.

'초거대 AI를 위한 AI 반도체'라는 주제로 발표한 이 이사는 “AI 모델로 트랜스포머가 대세가 되면서 AI 반도체 역시 트랜스포머에 최적화된 칩이 주류가 될 것”이라고 밝혔다.

트랜스포머 모델은 구글이 2017년 발표한 AI 모델이다. 문장 단어와 같은 순차 데이터 내 관계를 추적, 맥락과 의미를 학습하는 신경망이다. 챗GPT 등 대규모 언어 모델(LLM)은 대부분 트랜스포머 기반이다. AI 반도체 기업들이 트랜스포머 성능 개선을 최대 목표로 삼고 있는 배경이다.

이 이사는 “트랜스포머 등 AI 모델 규모가 점점 커지면서 매트릭스(행렬) 연산 성능이 매우 중요해졌다”며 “그러나 모두가 매트릭스 연산에만 매달리면 시장에서 차별화하기 힘들다”고 제언했다. 실제 네이버클라우드와 같은 AI 반도체 수요기업에 보다 매력적인 경쟁 우위를 제공해야한다는 의미다.

이 이사는 AI 모델 경량화를 AI 반도체 칩 차별화를 위한 주요 열쇠로 제시했다. AI에서 검색 모델을 학습한 후 중요도가 떨어지는 요소는 제거하는 기술(프루닝, 가지치기)이나 AI 값을 전환해 AI 모델 크기를 줄이고 에너지 효율을 높이는 양자화 기술이 대표적이다. 빠른 연산 속도를 구현하고 에너지 효율을 끌어 올려야 AI 서비스 기업들이 비용 등 운용 부담 없이 AI 반도체 칩을 사용할 수 있기 때문이다.

이런 AI 모델 경량화를 위해서는 하드웨어(SW) 뿐 아니라 소프트웨어(SW) 기술도 필요하다. 그는 “엔비디아가 잘하는 것이 SW 지원”이라며 “네이버 뿐 아니라 글로벌 AI 서비스 기업과 협력하며 빠른 속도로 기술을 고도화하고 있다”고 밝혔다.

Photo Image
제 2회 인공지능 반도체 포럼 조찬 강연회

이 이사는 AI 반도체의 메모리 혁신도 시급하다고 강조했다. AI 반도체 칩은 대규모 연산을 하다보니 전력 소모가 크다. 전력 효율성을 확보해야하는데, 기존 메모리로는 저전력을 구현하는데 한계가 있다.

이 이사는 “메모리 뿐 아니라 데이터 연결(인터커넥트)가 AI 반도체 칩 전력 소모에 많은 부분을 차지하고 있다”며 “이를 개선해 데이터 흐름을 효율적으로 바꾸는 것이 AI 반도체 핵심”이라고 부연했다.


권동준 기자 djkwon@etnews.com


브랜드 뉴스룸