성능은 특정 요구 사항에 적합한 SSD(solid-state drive)를 선택하려는 PC 사용자에게 중요한 요소입니다. 그렇지만 선택이 항상 간단한 것은 아닙니다. 가장 중요한 사항은 가격입니다. 용도에 따라 내구성 또는 보안 등 다른 특성이 우선시될 수도 있습니다.
하지만 모든 것은 결국 성능의 문제로 귀결됩니다.
더 정확히 말하자면, 다음과 같은 질문에 답해야 합니다. 어느 정도의 성능이 필요한가? 어떻게 측정할 수 있는가? 사용자가 수행하는 모든 작업(이 문서에서는 '워크로드'로 지칭)이 해당 스토리지 장치에 대해 동일한 사항을 요구하는가? 또는 고려해야 할 성능의 종류가 많은가?
그 대답은 상황에 따라 다릅니다. 또한, 제조 업체가 패키지에 기재하는 단일 속도 이외에도 고려할 게 많습니다. SSD 제품 패키지에 기재된 수치는 리얼월드 환경에서는 거의 볼 수 없는 최대 대역폭을 나타냅니다.
해당 수치는 사용자에게 드라이브의 성능에 대해 알려준다는 점에서 유용하긴 하지만, 시스템을 사용하면서 실제로 '느끼는' 속도와는 큰 관련이 없습니다. 그 이유에 대해서는 나중에 자세히 알아보겠습니다.
스마트한 구매자는 SSD의 공식 제품 사양 또는 사양표(판매 업체가 각 드라이브에 대해 이러한 사양을 게시하는 것이 일반적입니다)를 찾아보기도 합니다. 이러한 사양에는 일반적으로 4개의 수치가 나열되어 있습니다.
이 수치를 보면 훨씬 많은 것을 알 수 있습니다. 사양표에서 소위 '4가지 지표'를 확인했고, 한 가지 지표만으로는 '성능'을 제대로 파악할 수 없다는 것도 알게 되었습니다. 즉, 드라이브는 다양한 속도로 데이터를 읽고 쓰며, 순차 활동과 랜덤 활동 간의 구별이 있습니다(전송 크기라고 불리는 기능. 자세한 내용은 'I/O 특성에 대한 간단한 소개' 참조).
이러한 차이를 확인하면 SSD 성능을 더 정확히 파악할 수 있습니다. 하지만 본 자료에서 요약한 솔리다임 연구에 따르면, 이러한 지표들만으로는 아직 충분하지 않습니다.
앞으로 함께 논의해 보겠지만, 대부분의 리얼월드 워크로드는 읽기 작업과 쓰기 작업을 동시에 수행하는 경우가 많습니다. 스토리지 병목 현상은 아무런 문제가 되지 않을 때도 많습니다. 대신 CPU나 GPU와 같은 기타 시스템 리소스 때문에 사용자 환경에 제약이 발생할 수 있습니다. 이외에도 고려해야 할 문제가 있는데, 바로 일정 시간에 SSD 컨트롤러에서 보류 중인 I/O 요청의 수를 뜻하는 큐 뎁스(QD)입니다.
큐뎁스(QD)는 SSD 성능의 핵심 요소이기 때문에 좀 더 자세히 설명하고 넘어가겠습니다. QD가 높을수록 SSD가 병렬로 더 많은 작업을 실행할 수 있기 때문에 처리량이 높아집니다. 따라서 SSD 공급 업체가 제공하는 패키지 사양 및 사양표에 기재된 수치는 매우 높게(보통 32) 측정되어 있는 편입니다. 그러나 당사의 연구 결과에 따르면, 실제 사용은 대부분 1 또는 2에 불과한 낮은 QD에서 발생합니다. 대부분의 경우, 이론적 최대 성능은 낮은 QD 성능만큼 중요하지 않습니다.
또한 널리 사용되는 SSD 벤치마크 도구와 해당 도구에서 산출되는 결과가 리얼월드 성능과 얼마나 일치하는지 간략히 설명하겠습니다.
주어진 워크로드의 특성을 검토할 수 있는 방법은 얼마든지 있습니다. SSD 성능에서 중요한 것은 사용자 경험에 가장 큰 영향을 미치는 몇 가지 중요한 성능 메트릭을 식별하는 것입니다. 당사의 내부 도구를 사용하여 워크로드를 '추적'하고 기본 시스템 활동을 기록하면서(자세한 내용은 '연구 방법론' 참조) Adobe Acrobat을 실행하고 PDF 파일을 로드할 때 어떤 일이 일어나는지 관찰했습니다. 이러한 작업의 워크로드 지속 시간은 약 9초에 불과했음에도 불구하고, 수천 개의 개별 데이터 포인트가 포함된 추적 출력 파일이 생성되었습니다. 이들 모두가 사용자 경험에 큰 영향을 미치는 것은 아니지만 그중에는 분명히 핵심 요인이 있습니다. 이 세 가지를 각각 자세히 살펴보겠습니다. 1. 읽기/쓰기 혼합 읽기/쓰기 혼합 방식은 대부분의 사용자에게 가장 직관적으로 느껴질 것입니다. 사용자가 PC에서 수행하는 작업에 따라 드라이브에 데이터를 저장하거나 이미 있는 데이터를 검색하여 사용할 수 있도록 요청합니다. 어떤 종류의 활동이 읽기와 쓰기 작업을 유발하는지 어렵지 않게 추측할 수 있습니다. 애플리케이션을 시작하고 파일을 로드하는 활동은 읽기 중심의 활동인 반면, 데이터를 저장하는 활동은 쓰기 중심입니다. 한 형식에서 다른 형식으로 파일을 변환하려면 소스 읽기 작업과 아웃풋 쓰기 작업이 모두 필요합니다. 2. 순차 및 랜덤 혼합 순차 및 랜덤 방식의 혼합도 중요한 요소입니다. 드라이브에서 데이터를 쓰기 또는 읽기: 순차 전송은 드라이브의 연속 위치(논리 블록 주소 또는 Logical Block Address, LBA라고 함)에서 발생하는 반면, 랜덤 전송은 비연속 위치에서 작은 읽기 또는 쓰기로 구성되는 경향이 있습니다. 전송 크기는 보통 몇 킬로바이트 정도입니다. (눈치 빠른 독자라면 일부 SSD 공급 업체가 성능 사양과 함께 전송 크기를 제공한다는 것을 알고 있을 것입니다. 예시: '4KB 랜덤 읽기' 대 '128KB 순차 읽기'). 다수의 작은 파일을 읽거나 쓰는 작업은 본질적으로 랜덤에 가까운 반면, 개별 파일이 큰 워크로드의 경우 순차에 가깝습니다. 3. 큐뎁스 큐뎁스는 직관적이지는 않지만, 사용자 경험에 상당히 중요합니다. 아무리 작은 작업이라도 모든 워크로드는 엄청난 수의 I/O 작업을 생성합니다(Acrobat 9초 실행 및 로드 예시의 경우 6,000개 이상). SSD는 이러한 요청을 최대한 빠르게 처리하지만, 때로는 대기열, 선형, 대기 요청의 형태로 처리하기도 합니다. 스마트 아키텍처 덕분에 최신 SSD는 대기열 구조로 한 번에 여러 요청을 처리할 수 있습니다('병렬 처리'라는 개념). 데이터 처리량 측면에서 보자면, 여러 요청을 동시에 처리할 경우 높은 QD가 유리할 것입니다. 그러나 SSD는 요청이 들어오는 즉시 신속하게 대응하기 때문에, 일반적인 PC 워크로드는 긴 대기열을 형성하지 않습니다.
이러한 세 가지 I/O 특성은 이 문서에서 당사가 분석한 정보의 기초가 됩니다. 네 번째 요소는 스토리지 성능과 무관하지만 사용자 경험에 큰 영향을 미칠 수 있습니다. 병목 현상이 실제로 시스템의 다른 부품(예시: CPU가 가득 차거나 로컬 메모리가 모두 소모된 경우)에서 발생하는 경우, 스토리지 성능이 향상되더라도 사용자 환경이 개선되지 않습니다. 연구 방법론 실제 PC 사용 중에 내부에서 무슨 일이 일어나고 있는지 확인하기 위해 먼저 연구할 워크로드와 데이터 수집 및 분석 방법의 두 가지를 결정해야 했습니다. 워크로드 선택의 경우, 일반적인 생산 작업, 게이밍, 콘텐츠 제작이라는 세 가지 중요한 사용 '세그먼트'를 고려해 균형 잡힌 접근 방식을 선택했습니다. 당사의 워크로드 표본은 결코 완전하지 않으며, 그 결과가 모든 리얼월드 PC 환경에 적용되어서는 안 됩니다. 대신, 당사는 이 세 분야 각각의 사용자가 수행하는 일상 활동을 어느 정도 대표하는 활동의 모음을 연구하고자 했습니다. 또한, 읽기와 쓰기 작업의 I/O 패턴, 작은 파일과 큰 파일의 균형 있는 처리 등 다양한 결과를 얻고자 했습니다.
추적 실행 신호 각 워크로드를 실행 및 추적하는 '시작' 및 '정지' 신호를 규정했고, 결과에 혼선을 야기할 수 있는 다른 활동이 시스템에서 동시에 실행되지 않도록 했습니다. 데이터 수집 자체는 Microsoft Windows 기본 제공 기능을 사용하여 수행되었습니다. Microsoft는 Windows ADK(Windows Assessment and Deployment Kit)에서 WPR(Windows Performance Recorder)이라는 도구를 제공합니다. 해당 도구는 워크로드 실행 중에 ETW(Event Tracing for Windows) 이벤트를 실시간으로 기록합니다.
앞서 언급했듯이, 결과 추적 출력 파일에는 그야말로 수천 개의 데이터 포인트가 포함되어 있습니다. 그중에는 다음이 있습니다.
그런 다음 내부 도구를 사용하여 추적 데이터를 분석 및 시각화하기 위한 Excel 통합 문서로 구성했습니다.
실제로 이는 다음과 같습니다.
이번 연구에서는 워크로드를 미리 선택했기 때문에 결과가 다소 편향되어 보통의 PC에서는 '일반적으로' 어떤 데이터가 나타나는지 제대로 보여 주지 못했다는 한계가 있습니다. 당사가 연구한 12가지 중 아무것도 하지 않는 사용자도 많을 것입니다. 그렇다면 실제 PC 사용 추세를 반영하지 못할 수도 있는 특정 사례를 확인하는 일이 어느 정도나 유용할까요?
두 부분으로 나누어 답변드립니다. 첫 번째: 계속 지켜봐 주세요! 솔리다임은 '사용자 세션'을 특성화하고자 합니다. 즉, 대표 그룹에 속한 사람들이 온종일 수행하는 작업을 살펴보고, 특정 워크로드를 요청하지 않는다면 어떤 결과를 얻을 수 있을까요? 당사는 이 연구 결과를 몇 달 내로 발표할 예정입니다.
그리고 두 번째: 본 백서의 전체 연구 결과가 가장 일반적인 의미의 PC 사용량에 정확히 부합하지 않을 수 있지만, 여기서 설명하는 내용은 방향성이 올바르므로 본 논의의 시작점으로 유용합니다. 일부 결과(예시: QD 1 또는 2에서 발생하는 12개 워크로드의 전체 입출력 작업 중 92%)는 매우 압도적이어서 그 영향을 고려할 가치가 있습니다.
이제 워크로드에 대해 알아보겠습니다.
4가지 생산 작업의 워크로드에 대한 검토부터 시작하여 각 워크로드에 대한 조사 결과를 살펴보겠습니다.
Acrobat '실행 및 로드' 워크로드는 놀라운 결과를 보여 주는 일반 사용 사례입니다. 총 워크로드 크기는 약 300MB이며, 88%의 읽기와 12%의 쓰기로 나뉩니다. 활동은 대부분 4KB의 전송 크기로, 랜덤입니다.
측정된 최대 QD는 191인 반면, 기하 평균값은 2.1이었습니다. (이러한 현상은 연구된 워크로드의 대부분에서 나타납니다. QD는 단 1초 동안 측정되었지만 대다수의 작업은 1 또는 2에 불과했습니다.)
두 번째 생산 작업 워크로드도 비슷한 결과를 보여 줍니다. 본 과정에서는 이메일 메시지 및 관련된 항목이 포함된 PST(Outlook Data File)의 로드를 트리거하는 Microsoft Outlook을 시작합니다. 대부분 랜덤 읽기로 진행됩니다. 특히, 해당 워크로드에서 발생하는 I/O 작업의 98% 이상이 QD 1 또는 2에서 발생했습니다. 쓰기 작업량이 많은 작업으로는 PPT 슬라이드를 PowerPoint의 기본 제공 기능을 통해 MP4 동영상으로 내보내는 작업이 있었습니다. 해당 활동에 약 90초가 소요되었습니다.
대역폭 그래프는 해당 활동과 논리적으로 일치하는 결과를 보여줍니다. 전반부에서 읽기 작업이 많이 수행된 후, 새 동영상 파일이 생성될 때 대부분 쓰기 작업이 이어졌습니다.
최종 생산성 워크로드는 코로나19가 발생한 이후 더욱 보편화되고 있는 사용 사례를 나타냅니다. 즉, 원격 회의 등의 사례입니다.
이 활동의 경우, 가벼운 I/O 트래픽이 포함되고 99%는 QD가 낮습니다. 여기서는 네트워크에서 병목 현상이 일어날 가능성이 높으며 이는 다른 어떤 리소스보다 사용자 통화 환경에 큰 영향을 끼칩니다.
게이머들은 로딩을 기다리는 것에 익숙합니다. 이것이 해당 세그먼트를 매우 흥미롭게 만드는 부분입니다. 여기에는 개선의 여지가 많이 있습니다. 게임을 시작하고 세이브 파일과 새로운 레벨을 로드하는 일은 오래전부터 긴 대기 시간의 원인이었습니다. 그런데 이럴 때 시스템에서 무슨 일이 벌어지는 걸까요? 자세히 알아봅시다. 처음 살펴본 게임 워크로드는 비교적 가벼웠습니다. 데스크톱에서 League of Legends 게임 클라이언트를 로드하기만 하면 되었습니다. 이는 게임 플레이를 향한 첫걸음일 뿐입니다. 아직은 메뉴를 띄우는 게 고작이기 때문에 항목을 나눠서 살펴봤습니다. 전체 워크로드에는 18초가 소요되었으며, 500MB 이상의 데이터가 전송되었습니다. 이 중 85%는 읽기 작업이었고 80%가 낮은 QD였습니다.
앞에서 살펴본 생산성 워크로드와 달리, 여기에서 읽기 활동은 가장 일반적인 전송 크기가 128KB이며, 순차 전송이 압도적입니다. AAA 게임의 몰입 환경을 만드는 데 막대한 자산(모델, 텍스처 등)이 사용된다는 점을 고려하면 충분히 이해할 만한 부분입니다.
또한, 다른 시스템 리소스, 특히 메인 메모리와 GPU 리소스를 더 많이 요구하는 워크로드도 볼 수 있습니다.
해당 워크로드에는 게임을 시작하고 새로운 전투를 로드하는 동시에 OBS(Open Broadcaster Software)를 사용하여 활동을 스트리밍하고 기록하는 작업이 포함됩니다. 일반적인 AAA 게임 워크로드와 같이, 대부분의 읽기 작업은 순차로 이뤄졌습니다.
이는 다른 시스템 리소스 중 하나인 GPU가 최대 사용률에 도달한 워크로드의 예시입니다. 스토리지 성능과 무관한 병목 현상을 나타냅니다.
게임 '워크로드'는 약간 다른 시각을 제공합니다. 특정 활동을 정의하는 대신, 참가자에게 15분 동안 간단히 게임을 하도록 요청하여 오픈 월드 환경에서 캐릭터를 조작할 때 데이터가 어떻게 로드되는지 살펴봤습니다.
디스크 활동이 급격히 증가하지는 않았지만, 일정 기간 최대 4GB 이상의 데이터가 전송되는 등 소규모 읽기 스트림이 지속해서 증가했습니다. 해당 읽기 작업은 순차 읽기와 랜덤 읽기가 혼합되어 있었습니다.
마지막으로 미디어(동영상, 사진, 음원 등) 제작과 관련된 워크로드를 포괄하는 콘텐츠 제작 부문으로 넘어가 보겠습니다. 게임과 마찬가지로, 해당 부문은 프로젝트에 따라 대용량 데이터를 전송하거나 긴 시간 동안 대기해야 할 수 있습니다.
첫 번째 콘텐츠 제작 워크로드에서는 Adobe Photoshop 실행과 다중 레이어 PSD(프로젝트 파일) 파일을 로드하는 매우 일반적인 활동을 살펴보겠습니다.
이 10초 동안 약 1GB의 데이터 전송이 이루어졌습니다. 대부분의 읽기 작업은 랜덤이었지만, 이러한 랜덤 작업의 크기가 커서(대부분 각각 128KB) 데이터의 절반가량은 순차 읽기 작업이 차지했습니다.
블렌더는 다양한 산업의 제작자들에게 인기 있는 무료 오픈 소스 3D 창작 소프트웨어입니다.
평균 QD는 2.6이지만 작업의 77%는 QD 1 또는 2 수준입니다.
이러한 경우에는 4KB 읽기가 주요 I/O 유형입니다. 그러나 사용된 프로젝트 파일에 따라 더 높은 순차 전송 비율이 나타날 수도 있습니다.
해당 활동에는 외장 드라이브에서 Adobe Premiere Pro 프로젝트로 다수의 동영상 파일을 가져오는 작업이 포함되었습니다. 해당 작업은 제작자가 가족 슬라이드쇼를 만들거나 장편 필름을 동시에 편집할 때 수행할 수 있는 작업입니다. 대역폭 차트는 워크로드의 전반부에서는 프로그램으로 읽고 있는 다수의 파일을, 후반부에서는 동시 읽기 및 쓰기 활동을 보여줍니다.
본 문서의 마지막 워크로드는 기간과 크기 측면에서 모두 규모가 가장 큽니다. 대형 Premiere Pro 프로젝트 파일을 AVI 동영상으로 내보내는 데는 2시간 이상이 걸렸으며, 거의 0.5테라바이트의 데이터를 이동시켜야 했습니다.
차트에 표시된 바와 같이, 디스크 활동에서 가장 큰 비중을 차지하는 부분은 전체 활동 기간 중 마지막 20% 시점부터 발생했습니다. 해당 프로세스는 쓰기 작업이 많았지만(작업의 57%로 조정), 내보내기에도 상당한 비율의 읽기 작업이 포함되었습니다.
PC 사용자가 특정 요구 사항에 가장 적합한 SSD를 선택하고자 하는 경우, 해당 작업이 언제나 간단한 것만은 아닙니다. 가장 중요한 사항은 가격입니다. 용도에 따라 내구성 또는 보안 기능과 같은 특성이 우선 사항이 될 수 있습니다. 성능 또한 고려해야 합니다. 더 정확히 말하자면, 다음과 같은 질문에 답해야 합니다. 어느 정도의 성능이 필요한가? 어떻게 측정할 수 있는가? 사용자가 수행하는 모든 작업(이 문서에서는 '워크로드'라는 용어를 사용하여 각 작업을 지칭함)이 스토리지 디바이스에 대해 동일한 사항을 요구하는가? 또는 고려해야 할 성능의 종류가 많은가? 그 대답은 상황에 따라 다릅니다. 또한, 제조 업체가 패키지에 기재하는 단일 속도 이외에도 고려할 게 많습니다. 그 외에도 다른 I/O 특성이 워크로드에 따라 크게 달라졌습니다. 워크로드를 종합적으로 보면, 일반적으로 쓰기보다 읽기 비율이 더 높고 순차 읽기보다 랜덤 읽기가 더 많다는 것을 알 수 있지만(또한 이러한 사실이 모든 사용자와 워크로드에 걸쳐 일반적인 PC 사용에 해당할 것으로 예상되지만), 이러한 효과에 대한 결정적 진술은 '연구 방법론'에서 언급한 후속 단계로 보류되어 있습니다.
특정 워크로드에서 수행된 순차 또는 랜덤 작업의 비중을 보면, 해당 결과가 워크로드에 따라 크게 달라진다는 점을 확인할 수 있습니다. 초기 결과에 따르면 게임은 순차 의존도가 높고 생산성 작업은 랜덤 의존도가 높은 것처럼 사용 분야에 따라 차이가 있음을 알 수 있습니다.
이러한 결과를 바탕으로 실제 최종 사용자 경험을 평가하거나 예측하는 데 있어 다양한 SSD 벤치마크의 유용성에 대해 간략하게 논의할 수 있습니다.
1. ATTO Disk Benchmark는 다양한 전송 크기(사용자 설정 가능)에서 SSD의 읽기 및 쓰기 성능에 초점을 맞춘 결과를 제공합니다. 당사의 연구에 따르면, 리얼월드 환경에서 가장 중요한 크기는 4KB, 16KB, 32KB, 128KB입니다. 2. Anvil's Storage Utilities는 다양한 QD(4 및 16 포함)의 4KB 랜덤 전송과 중간 QD의 32KB, 128KB 및 4MB 순차 작업을 다루는 기본 테스트를 제공합니다. 또한, 읽기 및 쓰기 작업에 대한 종합적인 '점수'와 전체 점수를 산출합니다. 3. AS SSD Benchmark는 제한된 수의 기본 테스트와 함께 깔끔하고 간단한 인터페이스를 제공합니다. UI는 순차 테스트의 전송 크기 설정, 순차 또는 랜덤 테스트의 큐뎁스 설정을 지정하지 않습니다. 4. CrystalDiskMark는 접근성과 철저함을 두루 겸비하여 사용자와 IT 언론 사이에서 인기가 있습니다. 현재 버전인 8은 QD 1, 8에서 1MB 순차 전송과 QD 1, 32에서 4KB 랜덤 전송을 포함하는 기본 테스트 세트를 제공합니다. 이 도구에는 유용한 기능으로 혼합 읽기 및 쓰기 활동을 측정할 수 있는 '프로필'이라는 테스트도 포함되어 있습니다. 5. PCMark 10에는 4가지 스토리지 벤치마크 세트(전체 시스템 드라이브, 빠른 시스템 드라이브, 데이터 드라이브 및 드라이브 성능 일관성)가 포함되어 있습니다. 본 자료에 나열된 다른 도구와 달리, PCM10 테스트는 일반 애플리케이션에 대한 실제 추적을 통해 점수를 계산합니다. 해당 접근 방식은 사용자가 관심을 가질 만한 큐뎁스나 전송 크기 지정을 할 수 없기 때문에 사전에 사용자 지정을 할 여지가 적지만, 리얼월드 환경에 더욱 잘 맞출 수 있다는 장점이 있습니다. 해당 방식을 더 잘 이해하기 위해, PCM10 퀵 시스템 드라이브 벤치마크가 실행되는 동안 활동을 추적하여 다음과 같은 결과를 얻었습니다.
PCMark 10 방식은 12개 워크로드 표본의 집계 결과와 상당 부분 일치합니다. 평균 QD는 1.2(QD 1 또는 2에서 연산의 96% 수행)이며, 대부분의 연산은 랜덤 읽기입니다.
이러한 구조를 고려할 때, 해당 테스트의 결과는 리얼월드 환경에서 SSD의 성능을 측정하는 데 유용하지만, 사용자는 이를 SSD 비교 기준으로 사용하기 전에 그 계산 방법을 알아야 합니다.
PCMark 10 스토리지 벤치마크는 추적 활동의 I/O 패턴을 가속화하여 컴퓨팅 시간 및 호스트 대기 시간과 같은 소스 워크로드의 기타 요소를 제거합니다. 이는 스토리지 시스템에 큰 스트레스를 주고, 스토리지 성능 개선에 더 민감하게 반응하는데, 이러한 특성 덕분에 해당 벤치마크가 더욱 유용해집니다. 이러한 차이는 평균 CPU 시간과 GPU 시간이 각각 7%와 0%인 PCMark 10에 대한 솔리다임의 추적 결과에서도 나타납니다.
한 가지 주목할 만한 차이점은 솔리다임 측정 결과와 비교하여 PCMark 10 워크로드에서 측정된 4KB 전송 크기 비율입니다. 솔리다임 측정은 4KB 전송이 대부분이지만, PCMark 10에서는 그렇지 않습니다. 추가 연구 없이 이 차이를 추측하기는 어렵습니다. 실제 성능에 대해서는 다음 솔리다임 백서를 참고하십시오