엔비디아보다 2.1배 빠르다...KAIST, '오토GNN' AI 반도체 기술 개발

Photo Image
KAIST 오토GNN(AI 생성이미지, KAIST 제공)

엔비디아보다 추천 속도는 2.1배 빠르며 지연은 줄이고, 전력 소모까지 낮춘 인공지능(AI) 반도체 기술이 개발됐다. 대규모 데이터를 다루는 지능형 서비스의 속도와 에너지 효율을 동시에 높일 수 있는 기반이 마련됐다는 평가다.

한국과학기술원(KAIST·총장 이광형)은 정명수 전기 및 전자공학부 교수 연구팀이 그래프 신경망 기반 AI 추론 속도를 획기적으로 높일 수 있는 AI 반도체 기술 '오토GNN'을 세계 최초로 개발했다고 5일 밝혔다.

연구팀은 서비스 지연의 주된 원인이 AI 추론 이전 단계인 그래프 전처리 과정에 있음을 밝혀냈다. 이 과정은 전체 계산 시간의 70~90%를 차지하지만, 기존 그래픽처리장치(GPU)는 복잡한 관계 구조를 정리하는 연산에 한계가 있어 병목 현상이 발생해 왔다.

이를 해결하기 위해 입력 데이터 구조에 따라 반도체 내부 회로를 실시간으로 바꾸는 적응형 AI 가속기 기술을 설계했다. 분석해야 할 데이터 연결 방식에 맞춰 반도체가 스스로 가장 효율적인 구조로 바뀌는 방식이다.

연구팀은 필요한 데이터만 골라내는 UPE 모듈과 이를 빠르게 정리·집계하는 SCR 모듈을 반도체 안에 구현했다. 데이터 양이나 형태가 바뀌면 이에 맞춰 최적의 모듈 구성이 자동으로 적용돼, 어떤 상황에서도 안정적인 성능을 유지할 수 있도록 했다.

성능 평가 결과 오토GNN은 엔비디아의 고성능 GPU(RTX 3090) 대비 2.1배 빠른 처리 속도를 기록했다. 일반 CPU 대비 9배 빠른 성능과 함께 에너지 소모를 3.3배 줄이는 효율성을 보였다.

연구팀은 데이터 구조에 따라 스스로 최적화되는 AI 반도체 기술을 확보함으로써 추천 시스템이나 금융 사기 탐지처럼 복잡한 관계 분석과 빠른 응답이 필요한 AI 서비스에 즉시 적용할 수 있다고 설명했다.

정명수 교수는 “이번 연구는 불규칙한 데이터 구조를 효과적으로 처리할 수 있는 유연한 하드웨어 시스템을 구현했다는 점에서 의미가 크다”며 “추천 시스템은 물론 금융·보안 등 실시간 분석이 필요한 다양한 AI 분야에 활용될 것”이라고 말했다.

이번 연구는 지난달 31일부터 호주 시드니에서 열린 컴퓨터 아키텍처 분야 최우수 국제학술대회 HPCA 2026에서 발표됐다.


김영준 기자 kyj85@etnews.com

브랜드 뉴스룸