마이크로소프트, 차세대 AI 인프라 블랙웰 GB200 발표로 초고속 컴퓨팅 시대 열다
마이크로소프트가 엔비디아의 차세대 그래픽처리장치(GPU)인 블랙웰 GB200을 도입한 인공지능(AI) 인프라를 발표했다. 이 새로운 시스템은 수만 개의 블랙웰 GPU를 연결할 수 있어 역대 최대 성능의 컴퓨팅 환경을 구축할 수 있는 가능성을 제공한다. 사티아 나델라 마이크로소프트 CEO는 20일 시애틀에서 열린 '마이크로소프트 이그나이트 2024' 개발자 컨퍼런스에서 애저 ND GB200 V6를 소개했다. 이 시스템은 최첨단 AI 모델을 통해 대규모 데이터를 보다 효율적으로 학습시켜 비즈니스 성과를 향상하고 AI 경쟁력을 강화하기 위해 설계된 AI전용 서버이다.
ND GB200 V6는 두 개의 GB200 그레이스 블랙웨 슈퍼칩을 장착하고 있으며, 각 슈퍼칩은 엔비디아 NV링크-C2C 인터페이스를 통해 두 개의 블랙웰 GPU와 그레이스 CPU를 연결한다. 이 시스템은 통합 메모리 공간에 대한 고속 접근을 통해 대용량 언어 모델(LLM)을 처리할 수 있는 고속 메모리 기능을 갖추고 있다. ND GB200 V6는 이전 세대 대비 성능, 네트워킹, 보안 면에서 대폭 개선되어 AI 및 머신러닝 관련 작업에서 처리 속도가 최대 2배 향상됐다.
또한, 이 시스템은 의료, 금융, 국방 등 민감 데이터를 다루는 분야를 위해 보안 기능이 강화되었다. 나델라 CEO는 ND GB200 V6가 최신 대규모 AI 모델의 학습 및 추론 기능을 크게 개선하여 클라우드에서 AI 슈퍼컴퓨팅 성능과 확장성에 대한 새로운 표준을 제공할 것이라고 강조했다.
이 외에도 마이크로소프트는 AMD와 공동으로 개발한 애저 HBv5 가상머신(HBv5 VM)도 발표했다. HBv5 VM은 AMD 에픽(EPYC) 9V64H 프로세서를 기반으로 하며, 높은 성능과 비용 효율성을 목표로 하고 있다. 이 환경은 애저 클라우드에서 최적화되어 있으며, 타 베어메탈이나 클라우드에 비해 최대 8배 높은 성능을 제공하고, 온프레미스 시스템에서는 최대 35배 빠른 속도를 지원한다.
사티아 나델라는 이러한 성능 향상이 고대역폭 메모리(HBM)와 고성능 젠(Zen)4 코어, AMD 에픽 프로세서 플랫폼 및 엔비디아 인피니밴드 네트워킹 기술을 통해 가능하다고 설명했다. 또한, 애저 마이아(Maia)와 콜뱃(Cobalt)와 같은 마이크로소프트의 맞춤형 AI와 에너지 효율적인 솔루션도 소개되었다. 나델라 CEO는 마이아가 동부 지역에서 애저 오픈AI 추론을 담당하고 있다고 언급하며, 이를 통해 영향력 있는 서비스를 제공하고 있음을 강조했다.
마이크로소프트는 고성능 AI 인프라뿐만 아니라 이를 보호하기 위한 하드웨어 보안 모듈(HSM)도 도입했다. HSM은 클라우드 보안을 위한 전용 하드웨어로, 암호화 및 키 서명을 관리하여 외부 접근을 차단하고 위협을 사전에 방지하는 역할을 한다. 뿐만 아니라, 애저부트DPU(ADP)는 클라우드 인프라의 스토리지, 네트워킹, 가속 등 부하를 줄이고 성능을 최대 4배 향상시키는 데 기여한다. 나델라 CEO는 효율적인 작업 환경 마련과 업계 내 혁신 속도를 강조하며 많은 파트너와 협력하고 있다고 밝혔다.
│
이 포스트는 피시아(PHYSIA) 사에서 운영하는 게임메이커.KR 게임 개발 뉴스 블로그에서 작성되었으며, 공공의 이익에 기여하는 목적을 제외한 다른 용도의 무단 배포 및 수정을 금합니다. 참조 - 피시아(PHYSIA), 게임메이커.KR, 게임투비즈(GameToBiz), 게임S/W에이전시, 저널CTL코리아