액체 냉각 기본 사항

데이터 센터 구성 요소용 액체 냉각 개요

Liquid-cooled SSD for data center and AI factory
Liquid-cooled SSD for data center and AI factory

AI 훈련, 추론, 실시간 분석 및 점점 더 고밀도화되는 하드웨어 아키텍처는 데이터 센터에서 "정상 전력 범위"의 모습을 다시 쓰고 있습니다. 한때 5kW~15kW 범위에 편안하게 자리 잡았던 랙이 이제는 30kW, 60kW 및 그 이상으로 설계되고 있습니다. 전력 밀도가 상승함에 따라 기류, 팬 월, 핫 아일, 이중 바닥에 대한 기존의 가정이 무너지기 시작합니다. 어느 시점이 되면, 공기로 냉각하는 것은 단지 어려울 뿐만 아니라 비효율적이고 공간을 많이 차지하며 운영상 취약해집니다.

이것이 바로 액체 냉각이 특수 목적의 옵션에서 핵심 인프라 논의로 이동한 이유입니다. 데이터 센터 액체 냉각은 하나의 단일 제품이나 아키텍처가 아닙니다. 이것은 액체의 우수한 열용량을 사용하여 열을 이동시키는 일련의 기술로, 전체 시설을 풍동으로 바꾸지 않고도 고밀도 데이터 센터 냉각을 지원할 수 있습니다.

액체 냉각이란 무엇입니까?

액체 냉각은 발열 구성 요소를 통과하거나 그 근처로 액체 냉각제를 순환시킨 다음, 더 효율적으로 방산될 수 있는 다른 곳(종종 열교환기를 통해)으로 그 열을 배출하여 열을 제거하는 방법입니다. 데이터 센터의 맥락에서, 이것은 일반적으로 랙 내부, 서버 내부 또는 칩에 직접적으로 열이 발생하는 곳 근처에서 열을 포착하는 것을 의미하므로, 시설이 방대한 양의 냉각된 공기를 이동시키는 데에만 전적으로 의존할 필요가 없습니다.

액체 냉각은 물리학적 원리에 그 강점이 있습니다. 공기에 비해 액체는 단위 부피당 약 3,200배 더 많은 열을 흡수할 수 있습니다.1 즉, 다음과 같이 동일한 양의 열을 이동할 수 있습니다.

  • 더 낮은 유량
  • "실내" 온도 차이 감소
  • 더 적은 팬 에너지
  • 극단적인 기류 관리에 대한 의존도 감소

실제적인 측면에서 데이터 센터의 액체 냉각은 일반적으로 다음과 같은 열 제거 체인을 따릅니다.

  1. 열은 칩, 서버 또는 랙에서 포착됩니다.
  2. 열은 냉각제 루프를 통해 이동됩니다.
  3. 열은 설계에 따라 시설 용수 루프, 건식 냉각기, 냉각탑 또는 칠러 플랜트로 배출됩니다.

열을 "포집"하는 방법은 여러 가지가 있기 때문에 액체 냉각 기술은 여러 아키텍처로 나타나며, 일부는 점진적(후면 도어 열교환기 등)이고 일부는 구조전환적(액침 등)입니다. 데이터 센터는 액체 냉각 솔루션을 점진적으로 도입하거나 첫날부터 완전히 액체 냉각을 지원하는 시설을 설계할 수 있습니다.

액체 냉각을 사용하는 이유는 무엇입니까?

데이터 센터는 특히 AI 및 HPC를 확장할 때 성능, 경제성 및 위험 관리상의 복합적인 이유로 데이터 센터용 액체 냉각을 채택합니다.

더 높은 랙 밀도를 지원합니다.

많은 운영자가 특정 시스템 임계값을 넘어서면 공랭식은 점점 더 비실용적이 된다고 보고합니다. 업계의 의견에 따르면 일반적으로 랙당 약 20kW 이상에서 공기에만 의존하는 것의 어려움을 지적하지만, AI 랙은 훨씬 더 높은 범위에 도달할 수 있습니다.2

"공기 이동"에 소비되는 에너지를 줄일 수 있습니다.

팬과 기류 인프라는 비용이 발생합니다. 칠러를 고려하기 전에도 공랭식 설계는 점점 더 제한적인 서버 설계를 통해 공기를 밀어내는 데 상당한 전력을 소비하는 경우가 많습니다. 액체 냉각은 아키텍처에 따라 팬 요구 사항을 낮추고 시설이 더 높은 온도 설정에서 실행되도록 도울 수 있습니다.3

열 안정성을 향상시킵니다.

구성 요소가 뜨거워지면 스로틀링, 오류가 발생하거나 부스트 동작이 감소할 수 있습니다. 데이터 센터 환경의 액체 냉각은 보다 일관된 흡입구 및 구성 요소 온도를 제공하여 성능을 예측 가능하게 유지하는 데 도움을 줄 수 있습니다.

다양한 설계 가능: 더 고밀도인 랙, 더 작은 설치 공간, 새로운 시설 제약 조건

공간이 제한된 대도시 지역에 구축하거나 오래된 건물을 개조하는 경우, 수냉식 서버는 전체 HVAC 접근 방식을 재구축하지 않고도 최신 컴퓨팅 밀도로 나아가는 방안이 될 수 있습니다.4

데이터 센터의 액체 냉각이란 무엇입니까?

데이터 센터의 액체 냉각은 열 제거를 위한 열 전달 매체로 공기에만 전적으로 의존하는 대신 액체를 주요 전달 매체로 사용하는 모든 냉각 방식을 의미합니다.

실제로 대부분의 데이터 센터 구현은 다음 패턴 중 하나를 따릅니다.

  • 시설 중심의 액체 통합 
    데이터 센터는 액체 루프(냉수, 응축수, 온수)를 백본으로 사용하며, 종종 수냉식 랙을 지원하는 열교환기와 쌍을 이룹니다.
  • 랙 중심의 액체 냉각 
    수냉식 서버 랙은 인로우 냉각기, 후면 도어 열교환기 또는 서버를 냉각제 분배 장치(CDU)에 연결하는 칩 직접 접촉 매니폴드를 통합할 수 있습니다.
  • 서버/구성 요소 중심의 액체 냉각 
    서버는 GPU/CPU의 콜드 플레이트와 같은 가장 뜨거운 구성 요소에 직접 액체에 접촉하도록 설계되었으며, 특수 빌드에서 SSD 액체 냉각을 위한 특수 목적의 접근 방식이 점점 늘어나고 있습니다.

AI 성장이 가속화됨에 따라 지속 가능성 제약 조건도 설계 방향에 영향을 미치고 있습니다. 물의 가용성 및 냉각 방법의 절충안은 공개 보고에서 점점 더 눈에 띄게 나타나고 있으며, 운영자는 용량 확장과 함께 폐쇄 루프 및 물 사용량을 줄인 접근 방식을 모색하고 있습니다. 이제 물 사용 효율성(WUE)의 사용을 나타내는 새로운 지표가 추적되고 있습니다.5

데이터 센터 액체 냉각 기술의 유형

후면 도어 열교환기(RDHx)

후면 도어 열교환기는 랙의 후면 도어를 수냉식 라디에이터로 대체합니다. 뜨거운 배기 공기는 도어를 통과하면서 냉각된 후 실내로 유입됩니다.

가장 적합한 곳

  • 서버를 재설계하지 않고도 유의미한 열 제거가 필요한 과도기적 배포
  • 공랭식 랙과 액체 보조 랙이 모두 있는 혼합 환경

주의해야 할 주요 사항 

  • 여전히 서버를 통해 공기를 이동시키고 있으므로 팬 전력 소비는 동일하게 고려해야 합니다.
  • 안전한 작동을 위해 랙 수준의 배관 및 제어 장치가 필요합니다.

칩 직접 접촉(콜드 플레이트) 냉각

칩 직접 접촉은 종종 사람들이 데이터 센터 액체 냉각에 대해 기본적으로 떠올리는 방식입니다. 냉각제는 뜨거운 구성 요소(GPU, CPU, SSD)에 부착된 콜드 플레이트를 통해 순환됩니다.

이 범주는 특히 AI 데이터 센터의 액체 냉각에 중요합니다. AI 데이터 센터는 GPU가 열 프로파일의 대부분을 차지하며, 랙 밀도가 기존 설계를 훨씬 뛰어넘어 일부는 25만 개에 달하는 GPU를 수용하기도 합니다.6

이것이 매력적인 이유

  • 소스에서의 높은 열 포착 효율성
  • 잠재적으로 더 낮은 실내 기류 요구 사항으로 더 높은 밀도 가능

운영 고려 사항

  • 랙 내부의 배관 복잡성
  • 누출 감지, 빠른 분리 신뢰성, 유지 관리 절차

액침 냉각(단상 및 이상)

액침 냉각은 서버 또는 구성 요소를 유전성 유체에 배치합니다. 열은 유체로 직접 전달되며, 그런 다음 열교환기를 통해 냉각됩니다.

팀이 액침을 선택하는 이유

  • 매우 높은 열 제거 용량
  • 잠재적으로 팬을 최소화한 더 단순한 기류 설계

팀이 주저하는 이유

  • 유지보수 문화의 변화 및 액체에 잠긴 하드웨어 처리의 어려움
  • 공급업체 종속 우려 및 운영 학습 곡선
  • 호환성 및 재료 고려 사항

이러한 기술이 주류로 자리 잡음에 따라 ASHRAE 및 산업 지침은 계속 발전하고 있으며, 전력 밀도가 증가함에 따라 신뢰성, 운영성 및 위험 제어를 강조합니다.7

인로우 및 밀접 결합형 액체 냉각

인로우 냉각은 수냉식 장치를 랙 가까이에 배치하여 공기가 이동해야 하는 거리를 줄여 제어력을 향상시킵니다. 이는 일반적인 기존 시설 내의 고밀도 영역에서 종종 사용됩니다.

적합한 분야

  • 하이브리드 배포
  • 특정 목적의 고밀도 포드 (신속한 배포를 위해 설계된 전력, 냉각 및 하드웨어 랙을 통합하는 사전 엔지니어링된 모듈식 데이터 센터 장치)

시설 "온수" 루프 및 CDU

많은 최신 설계는 냉각제 분배 장치(CDU)를 사용하여 IT 루프에서 시설 루프를 격리합니다. 이를 통해 제어, 청결도 및 압력 관리를 향상할 수 있으며, 기존 시설의 개조를 더욱 수월하게 만들 수 있습니다.

수냉식 SSD: 작동 방식은 무엇입니까?

수냉식 SSD는 단순히 "더 나은 방열판"을 갖춘 SSD가 아닙니다. 이는 핫스왑 유지보수성, 규격화된 장착 및 대규모 유지 관리성 등 엔터프라이즈 스토리지의 운영 기준을 충족하면서 액체 냉각 인터페이스가 열을 효과적으로 제거할 수 있도록 설계된 SSD입니다.

Solidigm은 NVIDIA와 협력하여 핫 스왑 기능 및 단면 냉각과 같은 SSD 액체 냉각 문제를 해결했습니다. Solidigm의 완전 수냉식 SSD 솔루션은 단일 콜드 플레이트로 SSD의 양면을 냉각하며 공간 절약 및 손쉬운 유지 관리를 위해 핫스왑이 가능합니다. 이 기술에 대해 여기에서 가장 먼저 자세히 알아보십시오.

액체 냉각 대 공랭식

공랭식과 액체 냉각은 모두 IT 장비에서 열을 제거하지만, 근본적으로 다른 방식으로 이를 수행합니다. 이 비교를 사용하여 냉각 접근 방식을 밀도, 신뢰성 및 운영 요구 사항에 신속하게 일치시키십시오.

각각이 열을 이동하는 방법

공랭식

  • 팬을 사용하여 서버를 통해 시원한 공기를 밀어내고 실내로 열을 내보냅니다.
  • 핫 아일/콜드 아일, 격납, CRAC/CRAH 전달과 같은 실내 기류 설계에 의존합니다.

액체 냉각

  • 냉각제 루프를 사용하여 소스 근처에서 열을 흡수하고 열교환기로 전달합니다.
  • 실내 기류에만 의존하지 않고 배관, CDU/매니폴드 및 제어된 냉각제 흐름에 의존합니다.

각 접근 방식이 가장 잘 작동하는 곳

공랭식

  • 적당한 밀도의 범용 엔터프라이즈 랙
  • 하드웨어가 자주 변경되는 혼합 환경
  • 기존 기류 및 격납을 중심으로 최적화된 시설

액체 냉각

  • AI, HPC, 고처리량 컴퓨팅/스토리지 클러스터와 같은 고밀도 영역
  • 기류만으로 열을 관리하기 어려운 랙
  • 랙당 더 높은 전력에서 반복 가능한 확장을 위해 설계된 포드

랙 밀도가 증가하면 어떻게 됩니까?

공랭식

  • 동일한 열을 제거하기 위해 훨씬 더 높은 기류 볼륨이 필요합니다.
  • 팬 속도가 종종 상승하여 전력 오버헤드와 소음이 증가합니다.
  • 케이블링, 누락된 블랭크, 그리고 불균일한 압력과 같은 작은 기류 방해 요소는 핫 스팟을 유발할 수 있습니다.

액체 냉각

  • 열 제거는 냉각제 흐름 및 열교환기 용량에 따라 확장됩니다.
  • 일반적으로 밀도가 상승함에 따라 더 안정적인 구성 요소 온도를 유지합니다.
  • 수냉식이 아닌 구성 요소에는 여전히 중요할 수 있지만 실내 기류가 주요 제약 조건에서 덜 중요해집니다.

이것이 스토리지 및 SSD에 대해 갖는 의미

공랭식 스토리지

  • SSD는 사양 내 온도를 유지하기 위해 섀시 기류 및 방열판에 의존합니다.
  • 고처리량 NVMe 환경에서 지속적인 워크로드는 드라이브를 가열할 수 있으며 기류 마진이 부족할 경우 스로틀링 발생 가능성을 높일 수 있습니다. 
  • 스토리지에서 나오는 더 뜨거운 공기는 재순환되기 전에 시스템 내부의 구성 요소를 추가로 냉각하는 데 어려움을 초래할 수 있습니다.

SSD 액체 냉각

  • 드라이브는 특히 고밀도의 액체 지향 서버 플랫폼에서 수냉식 열 설계에 통합될 수 있습니다.
  • 엔터프라이즈 친화적인 구현은 예측 가능한 장착, 핫스왑 지원 및 유지보수성을 통해 데이터 센터 워크플로를 온전히 유지하는 동시에, 지속적인 성능을 위한 열 제거 개선에 중점을 둡니다. 
  • 팬을 제거하면 더 나은 시스템 설계가 가능하며 여전히 서비스 가능성 요구 사항을 허용합니다.

데이터 센터 팀을 위한 실용적인 시사점

공랭식은 기류 엔지니어링이 이미 운영의 기반이고 랙 밀도가 안정적인 범위 내에 유지되는 환경에 적합한 경향이 있습니다.

액체 냉각은 밀도 목표, AI 성장 또는 플랫폼 로드맵으로 인해 기류가 병목 현상이 되는 환경, 그리고 팀이 실내 수준의 HVAC보다 인프라(루프, 제어, 절차)에 더 가깝게 작동하는 냉각 시스템을 운영할 준비가 된 환경에 적합한 경향이 있습니다.

하이브리드 냉각이란 무엇입니까?

하이브리드 냉각은 동일한 시설, 행 또는 랙에서 공기 및 액체 접근 방식을 혼합하여 가장 적합한 곳에 각각을 사용합니다.

 하이브리드 냉각 시스템은 다음과 같은 경우에 일반적입니다.

  • 광범위한 엔터프라이즈 시설 내의 AI 포드와 같이 환경의 일부만 고밀도인 경우
  • 조직이 점진적인 채택을 원하는 경우
  • 기존 장비와 새로운 액체 지원 플랫폼이 공존해야 하는 경우

일반적인 하이브리드 냉각 패턴

  • GPU/CPU/SSD용 칩 직접 접촉 액체, 여전히 일부 구성 요소를 냉각하는 공기
  • 나머지 공간은 기존 방식을 유지하면서 일부 행에만 RDHx 적용
  • 전용 공간의 수냉식 AI 클러스터, 공랭식으로 남아 있는 범용 컴퓨팅

하이브리드 설계는 훌륭한 "가교 전략"이 될 수 있지만, 명확한 운영 경계가 필요합니다. 유지 관리 절차, 예비 부품, 모니터링 및 시설 조정을 문서화하고 조정해야 합니다.

데이터 센터용 액체 냉각의 장점은 무엇입니까?

더 높은 밀도 준비성

AI 서버의 부상은 주요 강제 기능입니다. AI 인프라와 관련된 논평에서는 종종 기존 수준을 훨씬 뛰어넘는 랙 전력 밀도를 언급하며, 일부는 고급 AI 시스템의 극도로 높은 밀도를 보고하기도 합니다. 

잠재적인 효율성 향상

아키텍처에 따라 액체 냉각은 다음을 수행할 수 있습니다.

  • 서버 팬 전력을 줄이거나 팬 제거를 허용하기도 합니다.
  • 열 배출 효율성을 향상시키고 열 창을 개선합니다.
  • 일부 설계에서 더 따뜻한 물 루프 활성화(경제화 지원)

더 나은 제어 및 더 적은 핫 스팟

액체 냉각은 종종 구성 요소 수준에서 더 엄격한 열 제어를 제공하여 기류 난기류, 케이블 장애물 및 랙 수준의 불일치로 인한 예기치 않은 문제를 줄입니다.

새로운 하드웨어 설계를 가능하게 합니다.

플랫폼이 발전함에 따라 수냉식 SSD 옵션을 통합하면, 특히 서비스 가능성이 보존되는 응집력 있는 시스템 열 전략을 지원할 수 있습니다. 

데이터 센터용 액체 냉각의 단점은 무엇입니까?

더 높은 선행 복잡성 및 CapEx

장기적인 효율성 사례가 강력하더라도 액체 냉각 솔루션은 일반적으로 다음을 요구합니다.

  • 배관 인프라
  • CDU 및 열교환기
  • 모니터링, 센서 및 제어 장치
  • 새로운 시운전 프로세스
  • 공기 냉각 대비 액체 냉각의 무게 및 영향에 대한 이해

운영 학습 곡선 

시설 팀, IT 팀 및 공급업체는 다음을 위한 공유 절차가 필요합니다.

  • 누출 감지 및 대응

  • 빠른 분리 처리

  • 예방 유지 관리

  • 냉각제 품질 관리

  • 각 시스템에 대한 구성 요소 선택의 정렬

누출과 관련된 위험 인식 

최신 설계는 누출 가능성과 영향을 최소화하기 위해 노력하지만, 엔터프라이즈 팀은 여전히 누출 시나리오를 일급 장애 모드로 취급하고 그에 따라 계획해야 합니다.

결론

액체 냉각은 특히 AI가 랙 밀도, 열 유속 및 인프라 스트레스를 가속화함에 따라 최신 데이터 센터의 핵심 기능이 되고 있습니다. 그러나 진짜 핵심은 "액체가 공기를 대체한다"는 것이 아닙니다. 데이터 센터의 액체 냉각이 가능성을 확장한다는 점입니다. 기존 방식이라면 비실용적이거나 비효율적이었을 더 높은 밀도, 더욱 일관된 성능, 그리고 새로운 플랫폼 설계를 가능하게 합니다.

그리고 AI 팩토리 대화에서 컴퓨팅이 중심이 됨에 따라 스토리지는 액체 냉각으로 전환되고 있습니다.  Solidigm™ 고유한 단면 수냉식 SSD 의 도입은 SSD 액체 냉각이 단순한 실험실 개념이 아님을 시사합니다. 그것은 차세대 고밀도 AI 지원 인프라를 구축하기 위한 툴킷의 일부가 되고 있습니다.

FAQ

데이터 센터는 랙 밀도와 열 출력이 기류가 효율적이고 안정적으로 처리할 수 있는 범위를 초과할 때 액체 냉각이 필요합니다. 많은 운영자는 랙당 ~20kW를 초과하면 공랭식 설계만으로는 점점 더 어려워진다는 것을 발견하며, AI 랙은 이보다 훨씬 높을 수 있습니다.

칩 직접 접촉은 콜드 플레이트를 사용하여 특정 구성 요소(GPU, CPU 및 SSD 등)에서 열을 흡수하는 반면, 액침은 서버나 구성 요소를 유전성 유체에 담급니다. 액침은 대량의 열을 제거할 수 있지만 종종 더 큰 운영상의 변화가 필요합니다.

아니요. 오늘날 AI 데이터 센터용 액체 냉각이 주요 원동력이지만, 열과 공간이 제약 조건이 될 때 고밀도 데이터베이스, 분석 클러스터 및 HPC 환경도 액체 기반 접근 방식의 이점을 얻습니다. 

수냉식 서버 랙은 실내 공기에만 의존하지 않고 액체로 열을 제거할 수 있도록 후면 도어 열교환기, 인로우 냉각기 또는 CDU에 연결된 매니폴드와 같은액체 냉각 인프라와 인터페이스하도록 설계된 랙입니다.

수냉식 SSD는 예측 가능한 맞춤 및 서비스 가능성과 같은 데이터 센터 요구 사항을 유지하면서 열을 수냉식 인터페이스(종종 콜드 플레이트)로 효율적으로 전달하도록 설계되었습니다. Solidigm은 효과적인 액체 열 제거를 가능하게 하면서 핫스왑 동작을 보존하는 설계를 갖추고 있습니다.

고성능 환경에서 NVMe SSD는 특히 액체 최적화 서버에서 기류가 감소할 때 무시할 수 없는 수준의 열을 발생시킬 수 있습니다. SSD 액체 냉각은 성능을 안정적으로 유지하고 더 고밀도의 플랫폼 설계를 지원하는 데 도움이 됩니다.

하이브리드 냉각은 동일한 환경에서 공기 및 액체 방식을 결합합니다. 예를 들어, AI 랙의 GPU/CPU에는 액체를 사용하는 반면 시설의 나머지 부분은 공랭식 상태를 유지합니다.  하이브리드 냉각 시스템은 예산이 제한된 운영에서 가장 현실적인 채택 경로인 경우가 많습니다.

데이터 센터의 물 사용량은 설계에 따라 다릅니다. 일부 냉각 시스템, 특히 증발식 접근 방식은 상당한 양의 물을 소비합니다. 다른 시스템은 폐쇄 루프 또는 물 절약형 설계를 강조합니다. 데이터 센터의 물 사용에 대한 조사가 강화됨에 따라 팀은 설계 또는 개보수 프로세스 초기 단계에서 물 및 에너지 절약을 고려해야 합니다. 

주요 운영 우려 사항은 누출 관리, 유지 관리 절차, 냉각제 품질 및 공급업체 변동성입니다. 최상의 완화 조치는 단순한 하드웨어 선택이 아니라 전략적 계획, 모니터링, 문서화된 프로세스 및 교육입니다.

칩 직접 접촉 구성 요소, 랙 수준 또는 인로우 도입을 갖춘 하이브리드 모델을 고려하십시오. 전력 밀도, 열 안정성, 팬 에너지 감소 및 유지 관리 영향과 같은 명확한 성공 지표를 정의하십시오. 그런 다음 운영상의 확신이 입증되면 확장하십시오.


저자 소개

Cecily Whiteside는 Solidigm의 Search 및 콘텐츠 전문가입니다. 그녀는 기술, 라이프스타일, 및 건강 웰니스 웹사이트& 및 간행물에 대해 글을 씁니다. Cecily는 여러 잡지에서 편집장으로 일했으며, 미국 및 해외의 다른 잡지에서 작가 및 사진작가로 기고했습니다.

참조 

1) https://spectrum.ieee.org/data-center-liquid-cooling

2) https://www.feace.com/single-post/higher-rack-density-requires-liquid-cooled-servers

3) https://blog.equinix.com/blog/2025/10/01/top-3-myths-about-data-center-operating-temperatures/

4) 참조: https://www.solidigm.com/products/technology/edge-ai-seismic-data-processing-immersion-cooling.html

5) https://ambient-enterprises.com/news-insights/why-liquid-cooling-data-center-design-matters/

6) https://x.ai/colossus

7) https://www.ashrae.org/technical-resources/standards-and-guidelines/read-only-versions-of-ashrae-standards