KT클라우드가 엔비디아 그래픽처리장치(GPU)를 적용한 인공지능(AI) 학습 전용 인프라 서비스, 'AI Train'을 출시했다.
AI Train은 초거대 AI 분야에서 단기간 집중적으로 대용량, 고사양의 GPU 공급이 필요한 학습 영역에 특화된 서비스다.
AI Train은 KT클라우드가 지난 2022년 선보인 HAC과 동일하게 대규모 GPU 노드 클러스터링과 동적할당 제어 기능을 지원한다.
AI Train은 컨테이너 기반으로 여러 대의 GPU 노드(node)에 컨테이너 클러스터를 구성할 수 있다.
손쉬운 접속, 네트워킹과 대규모 작업에 용이하다. 실제 GPU를 사용한 시간만 요금이 부과되고, GPU가 유휴 상태이면 컨테이너를 자동 반납하는 구조로 비용 효율성을 높였다.
특히 AI Train은 엔비디아 최신 인프라인 H100을 제공하고, A100, H100 등도 함께 사용할 수 있어 호환성과 범용성을 갖췄다. AI Train은 지난 2023년 정보통신산업진흥원(NIPA)의 고성능 컴퓨팅 사업·AI 바우처 사업 등 공공사업에 활용되며 사용 편의성을 검증받은 바 있다.
또 KT클라우드는 리벨리온과 협력해 공공과 기업 고객 대상의 추론 전용 신경망처리장치(NPU) 상품인 'AI SERV NPU'를 오는 6월 선보일 예정이다.
기존 GPU 기반 추론용 인프라 대비 가성비를 개선하고, 자동화 유지보수 기능과 스케일링을 가능하게 한다.
KT클라우드는 AI SERV NPU로 올해 진행 중인 AI 디지털교과서 사업, NIPA 주관의 고성능 컴퓨팅 사업, AI 바우처 사업 등에 적극 대응할 예정이다. AI 연구를 위한 다양한 언어 모델을 지원할 계획이다.
남충범 KT클라우드 본부장은 “KT클라우드는 지속적으로 확대되고 있는 시장 내 인프라 수요에 적극 대응하고, 차별화된 AI 인프라 서비스를 제공하고자 AI Train 서비스를 새롭게 선보였다”며 “다양한 파트너들과 협업을 이어가며 AI 클라우드 분야를 선도하고, 고객 사용성에 맞춘 AI 인프라 환경을 구현해 나갈 것”이라고 말했다.
박두호 기자 walnut_park@etnews.com