엔비디아 신형 인공지능(AI) 가속기 ‘블랙웰’ 납품에 또 한 번 차질이 생겼다. 발열을 감당하기 위한 서버 랙(Rack) 재설계가 필요하다는 것이다. 한편, AI 가속기 공급난이 지속되는 와중 블랙웰 납품 지연에 대한 데이터센터 사업자들의 우려가 커지고 있다. 지난 11월 17일 테크전문매체 ‘디인포메이션’은 엔비디이가 블랙웰 맞춤형 서버랙의 과열 문제 해결을 위해 서버공급업체들에게 수차례 설계 변경을 요구했다면서 블랙웰을 구매한 고객사들이 랙 사용 시기가 지연될 수 있다는 불안감을 드러내고 있다고 보도했다. 서버랙이란 컴퓨터 부품이 쌓인 하나의 완성품 서버를 의미한다. 각 층별로 메인보드・칩셋이 선반처럼 쌓여있어 ‘랙’(Rack)이라 불린다. 2024년 3월 엔비디아는 ‘블랙웰’을 공개하며 72개 칩셋을 한 데 엮은 서버랙 ‘NVL72’을 하나의 플랫폼으로 소개했다. NVL72에는 36개의 ‘그레이스’ 중앙처리장치(CPU)와 72개 블랙웰 그래픽처리장치(GPU)가 탑재된다. 거대한 냉장고만한 랙의 무게는 1.5t에 이르고 전력 소모량도 어마어마해 가동에 132㎾(킬로와트)가 필요하다. 단일 서버 기준 역대 최대 전력 소모다. 전력 소모량은 곧 발열로 이어
엔비디아(nVidia)가 인공지능 칩 블랙웰의 1년 치 물량이 완판된 것으로 알려졌다. 지난 10월 12일 미국 IT 전문매체 톰스하드웨어는 모건 스탠리의 분석가들을 인용해 향후 12개월 동안의 엔비디아 블랙웰 공급이 매진됐다고 보도했다. H100과 H200을 잇는 블랙웰은 엔비디아의 최신 인공지능 칩으로 4분기부터 양산을 앞둔 모델이다. 톰스하드웨어는 블랙웰을 주문하는 신규 고객들이 2025년 연말까지 기다려야 한다면서, H100과 H200의 호퍼 칩이 출시될 때와 같은 상황이라고 강조했다. 블랙웰은 생산 과정에서 패키징 결함으로 출시가 다소 늦어질 것으로 알려졌지만, 수요에는 문제가 없을 전망이다. 아마존 웹 서비스(AWS)를 비롯해 구글, 메타, 마이크로소프트(MS), 오라클 등 엔비디아의 기존 고객들이 향후 1년간 엔비디아가 파운드리인 TSMC를 통해 생산할 수 있는 모든 블랙웰을 사전 주문한 것으로 보인다. 첫 블랙웰 시스템은 마이크로소프트에 제공됐으며, 오픈AI에도 샘플이 제공됐다고 엔비디아는 밝혔다. 블랙웰을 앞세운 엔비디아는 2025년에도 인공지능 칩 시장에서 강세를 내세울 것으로 분석되는 상황이다. 현재 엔비디아의 시장 점유율은 약 80%에