가비아, 국산 NPU 기반 클라우드 서비스 출시

가비아(대표 김홍국·원종홍)가 국내 AI 반도체 기업 리벨리온 신경망처리장치(NPU) '아톰 맥스(ATOM-Max)' 기반 클라우드 서비스 'NPUaaS'를 9일 출시했다.

NPUaaS(NPU as a Service)는 NPU 인프라를 클라우드 방식으로 구독해 사용하는 서비스다. NPU는 학습된 AI 모델을 실제 서비스에 적용하는 추론 작업에 특화된 반도체다. 그래픽처리장치(GPU) 대비 전력 소모가 적고 비용 효율이 높아 GPU 의존도를 낮추려는 기업 대안으로 주목받고 있다.

가비아는 NPUaaS가 OS 커널 수준으로 세밀한 환경 설정과 커스터마이징이 가능하다고 설명했다. 특정 AI 워크로드 요건에 맞는 정밀한 인프라 구성을 지원, 서비스 목적에 따라 유연하게 확장할 수 있다고 덧붙였다. 대규모 LLM 서빙 등 고성능 추론 환경과 저지연이 요구되는 실시간 영상·음성 분석, 보안 정책상 커널 수준의 격리가 필요한 금융·의료·공공 분야 등에 적합하다고 전했다.

ATOM-Max는 1장 기준 128 테라플롭스(TFLOPS, FP16)의 연산 성능을 갖췄으며 NPU 메모리 64GB, CPU 16vCore, 시스템 메모리 256GB, 무료 트래픽 4TB를 제공한다.

가비아는 서비스 출시에 맞춰 도입을 검토 중인 기업을 대상으로 'AI 추론 프레임워크 최적화 컨설팅'을 제공한다고 밝혔다. AI 모델을 개발하고도 서빙 환경 구축 단계에서 어려움을 겪는 기업이 적지 않아 소프트웨어 개발 키트(SDK) 기반 환경 설정부터 성능 최적화까지 전문 인력이 직접 컨설팅을 지원한다고 전했다. 지원 프레임워크는 파이토치(PyTorch)·텐서플로(TensorFlow)며, 허깅페이스허브(Hugging Face Hub)에 등록된 오픈소스 모델과의 연동도 지원한다.

정대원 가비아 상무는 “AI 서비스의 경쟁력은 모델 성능만큼이나 추론 환경의 효율성에 달려 있다”며 “NPUaaS와 전문 컨설팅을 결합해 기업이 인프라 부담 없이 AI 비즈니스에 집중할 수 있는 환경을 만들겠다”고 말했다.

Photo Image

윤건일 기자 benyun@etnews.com

브랜드 뉴스룸