Solidigm AI Central Lab: AI를 위한 미래의 데이터 아키텍처 정의

Solidigm AI Central Lab은 16U 랙에 장착된 총 23PB 이상의 데이터 스토리지를 갖춘 122TB SSD를 사용하여 AI 모델 학습 실행 중 GPU가 계속 작동하도록 하는 스토리지 서브시스템의 능력을 측정합니다.
Solidigm AI Central Lab은 16U 랙에 장착된 총 23PB 이상의 데이터 스토리지를 갖춘 122TB SSD를 사용하여 AI 모델 학습 실행 중 GPU가 계속 작동하도록 하는 스토리지 서브시스템의 능력을 측정합니다.

데이터 스토리지 전문가가 있고, AI 워크로드 전문가가 있습니다. 두 가지를 모두 제공하는 한 회사를 찾고 있었다면 실망하고 돌아섰을 수도 있습니다.

그래서 새로운 Solidigm AI Central Lab이 나섭니다.

최신 모델 학습 및 추론 기술을 기반으로 구축된 Solidigm 연구소는 스토리지와 AI 기능을 결합하여 최첨단 연구를 수행하고, 주요 협력자와 함께 최종 수익을 개선하여 두 업계 모두를 발전시킵니다.

Solidigm AI 연구소의 가장 중요한 요소

이 연구소는 NVIDIA B200 및 H200과 같은 고성능 GPU, 800Gbps 이더넷 네트워킹, 그리고 물론 수많은 Solidigm SSD를 갖추고 있습니다. 캘리포니아주 랜초 코르도바의 Solidigm 본사 맞은편 시설에 자리 잡은 이 연구소는 AI 인프라 제공업체 FarmGPU와 함께 개발되었으며, 테스트를 위해 새로운 하드웨어와 소프트웨어를 신속하게 활성화합니다.

이 연구소는 하이퍼스케일러와 기업들이 전 세계적으로 데이터센터에 구축하고 있는 아키텍처를 반영하는 레퍼런스 아키텍처를 기반으로 설계되어 연구 결과를 고객 환경에 널리 적용할 수 있습니다.

Solidigm AI Central Lab은 16U 랙에 장착된 총 23PB 이상의 데이터 스토리지를 갖춘 122TB SSD를 사용합니다.

실제 AI 워크로드를 실행하는 것 외에도 이 연구소는 시스템 자원이 사용되는 방식과 병목 현상이 일어나는 지점에 대해 자세하게 파악하기 위한 원격 측정 데이터를 수집하는 기술도 보유하고 있습니다. 이를 통해 Solidigm 및 그 협력업체는 성능과 전력 효율성을 개선하기 위한 최적화 방안을 제안할 수 있습니다.

Solidigm SVP이자 제품 및 마케팅 책임자인 Greg Matson은 “스토리지 테스트를 실행하는 것만으로는 더 이상 충분하지 않습니다.”라고 말합니다.

스토리지의 한계를 뛰어넘는 가장 우수한 클러스터

이 연구소는 새로 설립되었음에도 불구하고 이미 자랑할 만한 여러 가지 업적을 가지고 있습니다. AI 모델 학습 실행 중 GPU가 계속 작동하도록 하는 스토리지 서브시스템의 능력을 측정하도록 설계된 가장 최근의 MLPerf 스토리지 테스트에서 FarmGPU는 24 Solidigm™ D7-PS1010 SSD가 탑재된 AI Central Lab 단일 노드 클러스터에 대한 결과를 제출했습니다. 당사 최고의 성능을 갖춘 드라이브로 구동되는 이 클러스터는 116GB/s의 속도를 달성했으며, 이는 테스트에서 측정한 노드당 처리량 중 가장 높은 수치입니다. 해당 아키텍처는 향후 테스트를 위해 여러 개의 노드로 쉽게 확장할 수 있습니다.

Solidigm 본사의 AI Central Lab은 122TB SSD를 사용하여 16U 랙에 23PB 이상의 데이터 스토리지를 갖추고 있습니다.

또한 이 연구소에는 지금까지 구축된 것 중 가장 밀도가 높다고 생각하는 스토리지 테스트 클러스터도 있습니다. 각각 122TB의 대용량 스토리지를 탑재한 192개의 Solidigm D5-P5336 SSD가 갖춰진 이 클러스터는 단 16U의 랙 공간에 23.4PB를 담을 수 있습니다. 이는 300년 이상 HD 비디오를 시청하거나 50억 곡의 노래와 맞먹는 양입니다.

연구소의 이러한 구성 및 기타 구성을 통해 Solidigm은 AI 애플리케이션에서 스토리지 성능과 밀도의 한계를 뛰어넘어 미래의 혁신과 최적화를 위한 새로운 길을 개척할 수 있습니다.

세계 최고의 AI 인프라 기업들이 함께

이 연구소 설립의 주요 원동력은 테스트할 다양한 기관의 하드웨어와 소프트웨어를 수용하고 새로운 차원의 공동 혁신을 여는 것이었습니다. 지금까지의 반응은 예상했던 대로입니다.

Matson은 “연구소의 AI와 스토리지 전문 지식의 독특한 조합에 대한 관심이 엄청나고, AI 분야 전반의 다양한 기업과 테스트 및 개척 영역 발굴 협약을 맺거나 진행 중에 있습니다”라고 말합니다.

초기 연구 결과는 우수한 스토리지가 AI 결과를 개선하는 방법에 대한 관점을 재정의하는 데 이미 도움이 되고 있습니다. 올해 초 Solidigm은 AI 워크로드 분석 및 기업 솔루션 제공 업체인 Metrum AI와 함께 검색 증강 생성(Retrieval-Augmented Generation, RAG)에 관한 백서를 발표했습니다 . 이 두 회사는 RAG 데이터를 시스템 메모리에서 SSD로 이전하여 얻을 수 있는 이점에 대해 광범위한 연구를 실시했고, 그 결과 성능과 정확성을 유지하면서 DRAM 사용량을 최대 57%까지 줄일 수 있었습니다.

세계 최고 수준의 다른 협력업체와의 연구가 진행 중이며, 추가 발표가 곧 있을 예정입니다.


저자 소개

Ace Stryker는 Solidigm의 시장 개발 담당 디렉터로, 회사의 데이터 센터 스토리지 솔루션 포트폴리오를 위한 새로운 애플리케이션에 중점을 두고 있습니다.