QLC SSD가 가치, 성능 및 밀도를 제공하는 방법

솔리다임, Gestalt IT의 Storage Field Day에서 발표

2023년 9월에 열린 Gestalt의 Storage Field Day에서 솔리다임은 QLC SSD가 가치, 성능 및 밀도를 위해 어떻게 설계되었는지에 대해 발표했습니다. 매일 생성되는 데이터 양과 해당 데이터의 응용 분야가 증가하고 있습니다. 스트리밍 서비스, 데이터 마이닝, 머신 러닝은 혁신적인 스토리지 솔루션이 필요한 읽기 집약적 워크로드의 몇 가지 예에 불과합니다.

Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.
Computer code with speed-oriented graphics to depict density and performance in SSD storage for data centers.

이 기사에서는 변화하는 워크로드와 읽기 집약적 스토리지 요구 사항을 해결하기 위해 QLC SSD를 사용하는 방법을 살펴봅니다. QLC SSD의 주요 특징과 기능에 대한 개요를 살펴보고 솔리다임 D5-P5336을 소개합니다. 워크로드의 변화가 스토리지 요구 사항의 변화로 이어집니다 데이터는 스토리지 및 소비와 관련된 워크로드 유형과 이러한 데이터의 저장 위치를 변화시키고 있습니다. 예를 들어, AI와 CDN(콘텐츠 전송 네트워크)은 백엔드에서 읽기 집약적 스토리지에 대한 수요를 증가시켜 대용량, 고밀도 스토리지에 대한 필요성이 강조되었습니다. 또 다른 예는 데이터가 소스에 최대한 밀접하게 저장되는 에지 컴퓨팅입니다. 그림 1은 이러한 변화하는 응용 프로그램과 그 요구 사항을 보여줍니다.

에지와 데이터 센터에 대한 데이터 사용 사례 및 수요를 비교하는 그래픽.

그림 1. 데이터 센터, 에지 인프라, 에지 장치와 관련된 변화하는 데이터 수요에 대한 개요.

그림 1은 스토리지 요구 사항이 진화하고 있는 3가지 영역, 즉 데이터 센터, 에지 인프라, 에지 응용 프로그램을 보여줍니다. 크기와 무게는 온프레미스 서버, IoT(사물 인터넷), 데스크톱 컴퓨터, 노트북 및 기타 휴대용 장치를 포함한 에지 장치에 영향을 미칩니다. 데이터 센터에서 에지 장치로 이동함에 따라 예측할 수 없는 환경에서 저전력 솔루션, 탁월한 안정성, 운영 효율성에 대한 요구가 증가하고 있습니다. 

읽기 중심 워크로드에 대한 데이터 전송 크기를 보여주는 그래픽.

그림 2. 최신 데이터 센터에서 발견되는 데이터 요구 사항을 보여주는 도표.

그림 2에서 볼 수 있듯이, 오늘날의 데이터 센터와 클라우드 환경에서 가장 일반적인 워크로드의 대부분은 읽기 중심입니다. 이러한 대략적인 워크로드의 특성은 전 세계의 클라우드 및 엔터프라이즈 환경에서 수집된 데이터를 기반으로 합니다. 차트의 왼쪽은 4KB에서 1MB 이상의 전송 크기를 보여줍니다. 차트의 아래쪽은 읽기/쓰기의 혼합, 오른쪽은 소규모/무작위에서 대규모/순차적인 데이터 패턴을 보여줍니다. 

그림 3에 표시된 응용 프로그램 유형의 주요 스토리지 요구 사항은 다음과 같습니다:

  • 조정 가능한 읽기 집약적 스토리지
  • 대용량 스토리지
  • 고밀도 스토리지
  • 확장 가능한 스토리지
  • 안정적인 스토리지

그러나 다른 요구 사항에는 전원 요구 사항 및 서비스 용이성이 포함됩니다. 과거에는 이러한 스토리지 요구 사항에 대한 주요 솔루션이 하드 디스크 드라이브(HDD)였습니다. 그러나 솔리드 스테이트 드라이브(SSD)를 비롯한 새로운 솔루션이 등장하고 있습니다.

기존 HDD를 대체하는 SSD

많은 응용 프로그램에서 HDD를 효과적으로 대체할 수 있는 것은 QLC NAND SSD입니다. QLC는 셀당 4비트의 쿼드 레벨 셀, NAND는 데이터를 유지하는 데 전원이 필요 없는 플래시 메모리 드라이브, SSD는 솔리드 스테이트 드라이브를 의미합니다.

1. QLC SSD: 용량 및 비용 효율성 증가

읽기 집약적 워크로드에서 뛰어난 성능을 발휘하는 QLC NAND SSD는 싱글 레벨 셀(SLC), 멀티 레벨 셀(MLC), 트리플 레벨 셀(TLC) NAND SSD보다 더 큰 데이터 용량을 제공합니다. 또한 QLC NAND SSD는 경제적이면서도 고밀도 스토리지를 제공하기 때문에 셀당 더 적은 비트를 저장하는 플래시 옵션과 경쟁할 수 있습니다. 

2. QLC SSD: 기가바이트당 비용 절감

또 다른 장점은 QLC NAND SSD가 기가바이트당 더 적은 비용으로 동일한 공간에서 더 큰 용량을 제공한다는 것입니다. 지연 시간이 짧을 뿐 아니라 HDD와 비교했을 때 [1] 안정성이 매우 높습니다. 그 이유는 기존 HDD와 달리 QLC NAND SSD에는 움직이는 부품이 없기 때문입니다.

데이터를 장기간 저장하는 데 중점을 둘 때, QLC NAND SSD는 데이터 백업 및 보관 목적에 우수한 옵션을 제공합니다. 이러한 용도에서는 성능, 비용, 용량의 균형을 이루어야 하기 때문에 QLC NAND SSD는 강력한 솔루션입니다.

QLC SSD용 응용 프로그램

QLC SSD에는 수많은 다양한 응용 프로그램이 있습니다. 예를 들어, 머신 러닝(ML)과 인공 지능(AI)의 경우 드라이브가 주로 데이터를 캡처하고, 다른 워크로드에서 분석을 처리하는 동안 드라이브에서 이 데이터를 가져옵니다. 

QLC SSD를 사용하는 다른 응용 프로그램에는 리테일 워크로드, 지진, 고성능 컴퓨팅(HPC)과 같은 데이터 마이닝을 위한 온라인 분석 처리(OLAP)가 있습니다. 금융 서비스 산업(FSI) 워크로드, 하이퍼 컨버지드 인프라(HCI), CDN도 있습니다. 

이러한 응용 프로그램에는 데이터에 대한 빠른 고대역폭 액세스와 지연 시간이 짧은 읽기 최적화 성능이 필요합니다. 솔리다임의 신제품은 이러한 집약적인 최신 스토리지 요구 사항을 충족합니다.

솔리다임 QLC SSD

솔리다임 D5-P5336은 최대 61,44TB의 읽기 성능에 최적화된 스토리지 솔루션입니다. 솔리다임의 가치 내구성 QLC SSD 옵션인 D5-P5336은 읽기 집약적인 워크로드를 위해 낮은 총 소유 비용(TCO)으로 고용량을 제공합니다.

읽기 집약적 스토리지를 지원하는 D5-P5336은 7,000Mbps로 읽고, 3,300Mbps로 쓸 수 있으며 소프트웨어를 통해 다양한 워크로드 요구 사항을 보다 효과적으로 충족하도록 조정할 수 있습니다. 부하 상태에서 탁월한 지연 시간, 낮은 오류율, 3,000P/E 주기에 이르는 내구성을 갖추고 있습니다.  [2]

  • E3.5, 7.68TB~30.72TB의 용량 범위 지원
  • U.2, 7.68TB~61.44TB의 용량 범위 제공
  • E1.L, 15.35TB~61.44TB의 용량 범위 제공

그림 2을 다시 살펴보면, 그림 3은 솔리다임 D5-P5336이 읽기 중심 워크로드에서 최적의 성능을 제공하는 위치를 보여줍니다.

솔리다임 D5-P5336이 읽기 중심 워크로드에서 어떻게 읽기 및 쓰기를 수행하는지 보여주는 그래픽.

그림 3. 최신 데이터 센터에서 발견되는 데이터 요구 사항과 솔리다임 D5-P5336이 가장 적합한 위치를 보여주는 도표.

이 QLC SSD 솔루션은 더 작은 설치 공간에 더 많은 데이터를 저장하고 빠르게 액세스하는 동시에 대규모 확장성과 매우 높은 데이터 밀도를 제공합니다. [3] 이것은 또한 이러한 SSD의 확장성을 높여줍니다. 예를 들어, 61.4TB 드라이브 24개가 장착된 솔리다임 D5-P5336은 총 1.47PB의 서버 용량을 제공합니다.

솔리다임 SSD를 기반으로 구축된 안정적인 스토리지 인프라를 통해 Taboola는 필요할 때 언제든 스토리지가 제공될 것이라는 확신을 가지고 추천 엔진 비즈니스를 더욱 확장할 수 있습니다.

Pisetsky는 "Taboola의 탈중앙화 하이퍼컨버지드 스토리지 아키텍처에서 솔리다임 SSD의 높은 안정성으로 유지 보수 비용을 절감할 수 있습니다."라고 말합니다.

강도 높은 테스트를 거친 안정성

마지막으로 솔리다임 D5-P5336의 안정성은 그림 4에 요약되어 있습니다. 진행된 강도 높은 테스트와 이 QLC SSD가 달성한 업계 최고의 데이터 안정성에 주목하십시오.

D5-P5336 SSD 신뢰성 및 안정성 테스트

그림 4. 솔리다임 D5-P5336의 품질 및 안정성.

최대 용량의 PCIe SSD

솔리다임 D5-P5336은 세계 최대 용량의 PCIe 4.0 SSD이며, [2] 널리 채택된 읽기 및 쓰기 집약적 워크로드에서 데이터를 가속화하는 기능; 고밀도 스토리지 환경을 위한 대규모의 확장성; [2] 하이퍼스케일 환경에서 총 소유 비용 및 지속 가능성 대폭 개선과 같은 주요 기능을 제공합니다. [2,4]

이러한 주제에 대한 자세한 정보는 이 링크를 클릭하여 Gestalt Storage Field Day 전체 동영상을 시청하십시오.


참고

[1] https://arstechnica.com/gadgets/2022/09/five-years-of-data-show-that-ssds-are-more-reliable-than-hdds-over-the-long-haul/

[2] https://www.solidigm.com/products/technology/d5-p5336-product-brief.html

[3] '웜 스토리지 설치 공간 최대 20배 감소' 주장은 1PB 또는 스토리지를 채우는 데 10(2U)의 랙 공간이 필요한 4TB HDD와 1PB의 스토리지를 채우는 데 1U의 랙 공간이 필요한 30.72TB 솔리다임 SSD D5-5336 E1.L 또는 U2 드라이브의 비교에 근거합니다. 이것은 최대 20배 더 큰 랙 통합입니다.

[4] https://estimator.solidigm.com/ssdtco/index.htm

그림 4 참고 사항

  1. 엔드투엔드 데이터 보호. 출처 – 솔리다임.  향상된 PLI(Power Loss Imminent) – 추가 펌웨어 검사로 전원 복구 시 데이터가 정확하게 저장되었는지 확인합니다  다른 응용 프로그램에서도 이 추가 펌웨어 검사를 제공하는지 여부는 불분명합니다.  강력한 엔드투엔드 데이터 보호 – ECC와 CRC를 동시에 활성화할 수 있는 이중화 기능이 내장되어 있습니다.  컨트롤러 내의 모든 중요한 스토리지 어레이(인스트럭션 캐시, 데이터 캐시, 인디렉션 버퍼, phy 버퍼)를 보호합니다.   어레이의 99% 이상에 대한 SRAM의 ECC 적용 범위는 업계 최고 수준입니다. 
  2. UBER 테스트.  출처 – 솔리다임.  UBER(Uncorrectable Bit Error Rate) - JEDEC 사양보다 10배 높은 수준으로 테스트되었습니다. 솔리다임은 드라이브의 수명 기간 동안 모든 범주의 조건과 사이클 수에서 1E-17을 테스트하며, 이는 JEDEC – 솔리드 스테이트 드라이브 요구 사항 및 내구성 테스트 방법(JESD218)에 명시된 1E-16보다 10배 더 높은 수치입니다. https://www.jedec.org/standards-documents/focus/flash/solid-state-drives.  SDC(Silent Data Corruption) - 1E-25로 모델링. 일반적인 안정성 데모 테스트에는 1K SSD를 1K 시간 동안 1E-18로 모델링하는 것이 포함됩니다.  솔리다임 드라이브는 로스 앨러모스 국립연구소의 중성자원에서 1E-23에 대한 SDC 취약성을 측정하고 1E-25로 모델링한 테스트를 거쳤습니다. 
  3. SDC 저항성. 출처 – 솔리다임.  드라이브는 로스 앨러모스 국립연구소의 중성자원에서 1E-23에 대한 SDC 취약성을 측정하고 1E-25로 모델링한 테스트를 거쳤습니다.  테스트는 먼저 특정 데이터 패턴으로 드라이브를 미리 채웁니다.  다음으로 중성자 빔이 드라이브 컨트롤러의 중앙에 집중되는 동안 입력/출력(I/O) 명령을 지속적으로 실행하면서 정확성을 확인합니다.  드라이브에 장애가 발생하여 멈추거나 브릭(brick) 상태가 되면 테스트 스크립트가 드라이브와 중성자 빔의 전원을 끕니다. 이후 드라이브를 재부팅하고 데이터 무결성을 검사하여 장애 원인을 분석합니다.  SDC는 런타임 동안 전원 차단 명령을 유발하거나 재부팅 후 사용 중인 데이터 손상으로 중성자 빔이 제어 로직과 충돌해 드라이브가 멈춘 경우에도 관찰될 수 있습니다.  드라이브는 데이터 무결성을 보장할 수 없을 때 논리적 비활성화(브릭) 상태가 되기 때문에 브릭 AFR은 오류 처리 효율성의 척도로 사용됩니다. 솔리다임 드라이브는 4세대에 걸쳐 이 테스트 절차를 사용해 왔습니다.  여러 세대에 걸친 누적 테스트 시간은 6백만 년이 넘는 운영 수명에 상당하며, 이 동안 SDC 오류는 한 번도 감지되지 않았습니다.  최근에 실시한 테스트에서는 솔리다임 D5-P5430 드라이브와 동일한 컨트롤러와 유사한 펌웨어를 사용하고 프록시 역할을 하는 솔리다임 D5-P5520 드라이브를 사용했습니다.  테스트한 경쟁사 드라이브는 Samsung 983 ZET, Samsung PM9A3, Samsung PM1733, Micron 7400, Micron 7450, Kioxia XD6, Toshiba XD5, WD SN840이었습니다. 
  4. 업계 최고의 AFR: 출처 - 솔리다임 AFR 데이터(2023년 3월 기준). 솔리다임에서 정의하는 연간 고장율(AFR)은 고객 반품 항목 중에서 평가 결과 완전히 작동하고 사용할 준비가 된 것으로 확인된 제품을 뺀 값입니다. 
  5. 실제 성능. 출처: 솔리다임. 자세한 내용은 부록 – D5-P5336 성능 테스트를 참조하십시오.
  6. 고객 지원 만족도.  출처 – Solidigm. 2021년 전체 콜센터 티켓 분석 기준. 

저자 소개

솔리다임의 제품 마케팅 매니저인 Jeniece Wnorowski는 데이터 센터 스토리지 솔루션 분야에서 14년 넘게 일한 전문가입니다. 인텔 기술 마케팅팀에서 경력을 시작한 Jeniece는 솔리다임에 합류한 후 다양한 회사 및 파트너와 함께 데이터 센터 SSD 혁신을 전파하고 있습니다. 퇴근 후에는 주로 아이들과 시간을 보내고, 주짓수를 배우고, 야외 활동을 즐깁니다.