에지 스토리지에 대해 알아야 할 모든 것

Solidigm SSD로 에지 솔루션을 사용하는 물류창고 로봇.
Solidigm SSD로 에지 솔루션을 사용하는 물류창고 로봇.

에지 AI에 필수적인 스토리지

기온 40°C에 식료품점 냉동고 위에 볼트로 고정된 절반 깊이의 싱글 소켓 서버를 상상해 보십시오. 작은 GPU가 조용히 웅웅거리면서 멀티모달 프롬프트를 실시간으로 처리합니다. 이것이 실제적인 에지 환경, 즉 수백 와트의 전력을 공유하고 신발 상자만한 공간에 공기 순환도 거의 없는 곳입니다. 그러한 환경에서는 컴퓨팅이 아닌 스토리지가 AI 추론이 원활하게 진행될지 지연될지를 결정합니다.

이러한 에지 병목 현상은 엄격한 전력 제한, 비좁은 공간, 따뜻한 주변 공기, 빠르게 성장하는 모델 파일 등에 의해 구체적 형태로 나타납니다. Antillion의 웨어러블 서버, Zhengrui의 가축 유전체학 플랫폼 및 PEAK:AIO의 온프레미스 AI 클러스터의 현장 결과는 구형 SSD 또는 하드 디스크 계층을 최신 Solidigm™ 드라이브로 교체함으로써 설치 공간을 줄이고, 전력 사용을 줄이며, GPU에 데이터를 계속 공급하는 방법을 보여줍니다. 적절한 스토리지를 선택하면, 애플리케이션을 상가 내 클리닉에서 사용하든, 산업 현장 또는 시골 변전소에서 사용하든 장소와 관계없이 에지에서의 까다로운 제반 문제를 해소하고 측정 가능한 성능상의 여유를 확보할 수 있습니다.

코어보다 에지가 더 어려운 이유

클라우드 홀의 하이퍼스케일 랙은 10kW 이상을 끌어다 쓸 수 있으며 일련의 냉각기 아래에 설치합니다. 반면, 에지 노드는 소비전력과 부피 및 온도가 매우 제한되는 청소용품 보관함이나 기둥에 장착된 캐비닛처럼 협소한 공간에 설치할 수 있습니다. 특정 목적으로 설치된 많은 에지 서버는 CPU, GPU, 네트워킹 및 스토리지를 감당해야 하는 한도인 200W~300W 정격의 전원공급장치와 함께 배송됩니다. 코어 랙은 이제 평균 약 12kW의 전력을 소비하며, AI 클러스터의 경우 훨씬 더 많아지는 추세입니다. 이는 에지의 경우에 기대할 수 있는 것보다 10배 단위 이상의 여유 전력을 의미합니다.

공간 제한도 동일합니다. 짧은 깊이의 1U 섀시는 2.5인치 드라이브 베이 2개와 E1.S 드라이브 슬롯 1쌍만 제공할 수도 있으므로 시스템당 용량이 로컬 모델 및 데이터 세트의 크기를 직접적으로 제한하게 됩니다. 예비 슬롯이 거의 없기 때문에 나중에 확장할 때는 단순한 드라이브 교체가 아닌 고비용의 대폭적인 업그레이드가 필요한 경우가 많습니다. 따라서, 초기부터 적절한 용량을 확보하는 것이 성능상의 여유와 ROI를 보장하는 데 매우 중요합니다.

냉각 조건 역시 열악합니다. Lenovo의 ThinkEdge SE450과 같은 견고한 에지 시스템은 대부분의 데이터 센터의 냉각 통로의 목표 온도인 30°C보다 훨씬 높은 최대 45°C의 입구 온도에서도 지속적으로 작동할 수 있습니다. 이러한 공기 중에서는 10W 이상의 전력을 소모하는 드라이브 하나만으로도 소형 인클로저의 온도가 사양을 벗어날 수 있습니다. 환풍기는 매장, 클리닉 및 소매 매장을 음향 한계 내로 유지하기 위해 저속으로 회전시켜야 하므로, 모든 구성 요소는 자체에서 열을 효율적으로 배출해야 합니다.

대역폭으로는 그 차이를 만회하지 못합니다. 클라우드 서버가 페타바이트(petabyte, PB) 스토리지 패브릭에서 데이터를 스트리밍하는 경우, 에지 박스는 단일 1GbE 회로 또는 공유 5G 링크에 의존하는 경우가 많습니다. 따라서 모델, 임베딩, 비디오 버퍼 및 로그는 GPU로부터 수 마일이 아닌 수 인치 이내로 떨어져 있어야 합니다. 서비스 방문은 빈번하지 않으므로 드라이브는 수년 동안 관리가 없어도 동작 상태를 유지해야 합니다. 

Solidigm SSD 스토리지는 에지 스토리지 솔루션용 내구성, 밀도, 처리량의 핵심입니다.

이와 같이 결합된 제약사항들 때문에 스토리지 점검 목록을 다시 작성해야 합니다. 에지 빌더는 클라우드에 필적하는 용량을 단 한두 개의 E1.S 드라이브 슬롯에 담아야 하고, 수 와트 미만의 전력으로도 급격히 증가하는 센서 트래픽을 감당할 수 있는 쓰기 내구성과 캐비닛 내부 온도가 40도 이상일 때도 GPU를 제대로 동작할 수 있는 읽기 속도가 필요합니다.

성능 대 용량: 워크로드 우선 설계

일부 에지 워크로드의 성패는 성능에 달려 있습니다. 실시간 영상 분석, 실시간 유전체 매칭 및 빠른 검색 증강 생성에는 마이크로초 단위의 지연 시간으로 초당 수십 기가바이트의 지속적인 읽기 대역폭이 요구됩니다. 자율주행 자동차 데이터 캡처 또는 현장 컴플라이언스 로깅을 포함한 기타 워크로드는 몇 주 또는 몇 달간의 상황 정보를 유지하기 위해 용량에 더 큰 가치를 둡니다. 어떤 조합이든 설계자는 여전히 동일하게 빠듯한 전력 한계 내에서 비좁은 인클로저 안에 내장시켜야 합니다.

효율성을 높이는 기술은 실제 트래픽 패턴과 일치하는 내구성, 처리량 및 밀도를 선택하면서도 CPU, GPU 및 네트워킹을 위한 충분한 열적 여유공간을 남겨 두는 것입니다.

균형 잡힌 에지 스택의 구조

가장 성공적인 설계는 스토리지를 계층화하여 각 계층이 그 강점을 발휘하게 하는 것입니다.

  • 쓰기 버스트 캐시 — 조기 마모 없이 불규칙한 유입 데이터 트래픽을 흡수합니다.
  • 작업 계층 — 예측 가능한 처리량과 지연 시간으로 가속기에 데이터를 공급합니다.
  • 용량 계층 — 유휴 상태에서 전력을 적게 소비하면서 컨텍스트 파일을 저장합니다.

각 계층은 실제 워크로드에 맞게 구성하기 때문에 Solidigm SSD를 사용하는 대표적인 스택은 8개 미만의 베이에 들어가며, 60W 미만의 전력을 소비하고, 40°C 초반대의 주변 온도에서도 문제없이 동작할 수 있습니다. 위와 동일한 패턴으로 클리닉에서는 실시간 DICOM 영상을 수집하고, 매장에서는 소매 영상 데이터를 선별하며, 변전소에서는 1년치 파형 데이터를 아카이브하면서도 캐비닛의 자원을 소진시키지 않습니다.

경제성이 디자인을 강화합니다. 저용량 드라이브 12개를 Solidigm 고용량 NVMe SSD 3개로 교체하면 드라이브 수를 75% 축소하고, 열 발생을 약 150W 낮추며, 스토리지 관련 제반 문제를 약 25% 줄일 수 있습니다. 절약된 전력과 슬롯은 추가 GPU, 더 빠른 네트워크 카드 또는 단순히 더 조용한 팬을 위한 여유 자원으로 바꿀 수 있습니다.

현장에서 얻은 실제 교훈

최초 대응 회사 Antillion

Antillion은 현장 직원이 조끼에 착용하는 소형 에지 컴퓨터를 제작합니다. 초기 버전은 2.5인치 SATA SSD에 의존하여 용량과 처리량이 모두 제한되었습니다. 이 회사는 이 디스크를 고성능 SSD D7 시리즈 드라이브 제품군의 Solidigm E1.S NVMe SSD로 교체했습니다. 이 교체를 통해 고해상도 영상 및 센서 스트림의 대역폭이 두 배 이상 증가했고, 소프트웨어 배포 시 시스템 구축 시간은 약 30% 단축되었으며, 수백 대의 유닛을 배송한 이후에도 현장에서의 드라이브 고장이 한 건도 발생하지 않았습니다. 혁신적인 Solidigm E1.S 드라이브 덕분에 Pace A2 전술 노드는 무게를 늘리지 않고도 대용량 데이터를 처리할 수 있으며, 견고한 에지 장비가 더 이상 크기 때문에 용량을 포기할 필요가 없다는 점을 입증했습니다. 이 기사에서 Antillion과의 협업에 대해 자세히 알아보십시오. Antillion과 Solidigm의 에지 환경에서의 혁신 추구.

Zhengrui Technology 가축 유전체학

쓰촨 소재 Zhengrui Technology는 유전체 서열, 표현형 이미지 및 환경 원격 측정 데이터를 수집하는 가축 사육 분석 플랫폼을 운영합니다. 24개의 Solidigm D5-P5336 대용량 드라이브로 채워진 2개 유닛의 단일 서버는 현재 약 700TB의 데이터를 저장하고 약 1백만 회의 랜덤 IOPS를 지속적으로 처리할 수 있습니다. 하이브리드 HDD 및 저용량 SSD 스토리지에서 전부 대용량 Solidigm SSD 구성으로 전환하여 랙 공간을 줄이고 스토리지 전력을 79% 줄였으며, 그 결과 현장에서 질병 예측 및 육종가 모델을 학습시킬 추가 GPU에 필요한 예산과 열적 여유를 확보했습니다. 이 기사에서 Zhengrui와의 협업에 대해 자세히 알아보십시오. Zhengrui Technology와 Solidigm SSD.

PEAK:AIO 연구 클러스터 

PEAK:AIO는 Dell과 협력하여 NVIDIA ConnectX-7 어댑터를 통해 초당 120GB를 처리하는 2개 유닛의 AI 데이터 서버 1대를 구축했습니다. 이 시스템은 24개의 NVMe 베이를 모두 Solidigm 61.44TB 대용량 SSD로 채워 위성 실험실과 지역 클리닉에 적합한 소형 섀시에서 1.5PB를 제공합니다. 전력-예산 분석에서는 동일한 구성으로 50MW 데이터센터 모델에서 10~20MW의 전력 절감 효과를 보여주었으며, 사이트의 총 전력소비량을 늘리지 않고도 GPU 용량을 약 50% 더 추가할 수 있는 여유를 확보했습니다. 이 기사에서 PEAK:AIO와의 협업에 대해 자세히 알아보십시오. PEAK:AIO, MONAI 그리고 Solidigm: 의료 AI를 위한 스토리지 혁신.

이러한 구축 사례를 종합해 보면, 하나의 패턴이 분명히 드러납니다. 스토리지 밀도가 높아지고 TB당 전력이 줄어들면, 에지 서버가 더 축소되고 운용 비용이 절감되며, 가속기는 데이터를 기다리는 대신 지속적으로 작업을 수행하게 됩니다.

Solidigm 포트폴리오와 에지 요구의 매핑

캐싱 계층 스토리지용 Solidigm D7-P5810, 성능 계층 스토리지용 Solidigm D7-PS-1010, 용량 계층 스토리지용 Solidigm D5-P5336.

아래 표는 세 가지 드라이브 옵션과 전력이 제한된 에지 서버 내의 캐시, 작업 및 용량 부분과 어떻게 일치하는지 보여줍니다.

특성 Solidigm™ D7-P5810 Solidigm™ D7-PS1010 Solidigm™ D5-P5336
범주 캐싱 계층 성능 계층 용량 계층
에지 AI 역할 쓰기 버스트 캐시 인기 모델 및 인덱스 스토어  대규모 컨텍스트 및 보존
인터페이스 PCIe 4.0 x4 PCIe 5.0 x4 PCIe 4.0 x4
폼팩터 U.2  15mm E1.S 9.5mm,
E1.S 15mm,
E3.S 7.5mm,
U.2 15mm.    
U.2 15mm,
E3.S 7.5mm,
E1.L 9.5mm
순차 읽기 약 6.4GB/s 약 14.5GB/s 약 7GB/s
랜덤 읽기 약 0.9M IOPS 약 3.1M IOPS 약 1M IOPS
용량 범위 0.8~1.6TB 1.92~15.36TB 7.68~122.88TB
내구성(DWPD, 5년)   약 50 1.0 약 0.5
유휴/유효 전력 5W/10W 미만 5W/23W(평균) 5W/약 25W

실용적인 구성은 데이터 급증에 대응하기 위한 캐시 계층 SSD 드라이브 두 개, 활성 데이터 세트를 처리하기 위한 소규모 Gen5 성능 계층 SSD 드라이브 그룹, 그리고 컨텍스트 데이터를 위한 고용량 SSD 드라이브 한두 개를 조합하는 방식입니다. 쓰기 압력과 내구성, 가속기 수요와 대역폭, 그리고 유지 요구와 밀도를 일치시키면 에지 환경의 제약을 여유로 바꿀 수 있습니다. 적절한 Solidigm 계층을 갖추면, 클라우드급 AI를 매장, 공장, 또는 외곽 배전선 옆에서도 구축할 수 있으며, 전체 데이터센터 수준의 예산을 들이지 않아도 됩니다.

결론: 에지 인에이블러로서의 스토리지

에지 컴퓨팅은 한때 라우터와 퓨즈 박스가 있던 공간으로 AI를 밀어넣고 있습니다. 이렇게 협소한 공간에서는 플래시 스토리지의 선택에 따라 GPU에 도달하는 데이터의 양과 섀시의 발열 수준, 그리고 투자 회수가 얼마나 빨리 이뤄지는지가 결정됩니다. 필드 구축 결과를 보면 다음과 같이 반복 가능한 패턴을 볼 수 있습니다. 

  • 제어하기 어려운 쓰기 작업을 위한 캐시 계층 SSD 사용
  • 작업 셋(Working set)용 Gen5 고성능 SSD 사용
  • 로컬로 유지해야 하는 모든 것을 위한 대용량 SSD 사용

Antillion의 전술 장비, Zhengrui의 가축 유전체학 클러스터 및 PEAK:AIO의 연구 서버는 모두 이러한 패턴을 따랐으며, 더 작은 설치공간, 더 낮은 에너지 사용 및 더 안정적인 가속기 활용 패턴을 보였습니다.

요구는 계속 증가하기만 할 뿐입니다. 모델은 계속해 확장되고, 멀티모달 추론은 접근 패턴을 더욱 다양화하며, 분석 스택은 더 깊은 읽기 버스트를 유발합니다. 따라서 스토리지는 슬롯당 더 많은 테라바이트, GPU 메모리로 가는 더 빠른 데이터 경로, 변화하는 워크로드에 적응할 수 있는 더 스마트한 계층화라는 세 가지 방향을 따라 동시에 성장해야 합니다. 

Solidigm의 혁신적이고 시장을 선도하는 로드맵은 수냉식 냉각판을 이용하는 E1.S SSD, 풀 스피드 PCIe Gen5 레인 및 근접 장치 데이터 감소를 목표로 하는 펌웨어를 통해 이미 그러한 방향으로 전환하고 있습니다. 이러한 기능들이 발전함에 따라, 더 무거운 AI 파이프라인도 데이터센터를 떠나 센서가 있는 현장에서 실행할 수 있습니다.


저자 소개

Jeff Harthorn은 Solidigm의 AI 데이터 인프라 마케팅 분석가입니다. Jeff는 솔루션 아키텍처, 제품 계획 및 마케팅에 대한 실무 경험을 갖추고 있습니다. 그는 수냉식 E1.S SSD에 대한 경쟁력 분석을 포함한 기업 AI 메시징을 구체화하여 기술적 세부사항을 고객과 협업 파트너를 위한 명확한 비즈니스 가치로 변환해 줍니다. Jeff는 새크라멘토 캘리포니아 주립대학에서 컴퓨터 공학 학사 학위를 받았습니다.