AI 훈련, 추론, 실시간 분석 및 점점 더 고밀도화되는 하드웨어 아키텍처는 데이터 센터에서 "정상 전력 범위"의 모습을 다시 쓰고 있습니다. 한때 5kW~15kW 범위에 편안하게 자리 잡았던 랙이 이제는 30kW, 60kW 및 그 이상으로 설계되고 있습니다. 전력 밀도가 상승함에 따라 기류, 팬 월, 핫 아일, 이중 바닥에 대한 기존의 가정이 무너지기 시작합니다. 어느 시점이 되면, 공기로 냉각하는 것은 단지 어려울 뿐만 아니라 비효율적이고 공간을 많이 차지하며 운영상 취약해집니다.
이것이 바로 액체 냉각이 특수 목적의 옵션에서 핵심 인프라 논의로 이동한 이유입니다. 데이터 센터 액체 냉각은 하나의 단일 제품이나 아키텍처가 아닙니다. 이것은 액체의 우수한 열용량을 사용하여 열을 이동시키는 일련의 기술로, 전체 시설을 풍동으로 바꾸지 않고도 고밀도 데이터 센터 냉각을 지원할 수 있습니다.
액체 냉각은 발열 구성 요소를 통과하거나 그 근처로 액체 냉각제를 순환시킨 다음, 더 효율적으로 방산될 수 있는 다른 곳(종종 열교환기를 통해)으로 그 열을 배출하여 열을 제거하는 방법입니다. 데이터 센터의 맥락에서, 이것은 일반적으로 랙 내부, 서버 내부 또는 칩에 직접적으로 열이 발생하는 곳 근처에서 열을 포착하는 것을 의미하므로, 시설이 방대한 양의 냉각된 공기를 이동시키는 데에만 전적으로 의존할 필요가 없습니다.
액체 냉각은 물리학적 원리에 그 강점이 있습니다. 공기에 비해 액체는 단위 부피당 약 3,200배 더 많은 열을 흡수할 수 있습니다.1 즉, 다음과 같이 동일한 양의 열을 이동할 수 있습니다.
실제적인 측면에서 데이터 센터의 액체 냉각은 일반적으로 다음과 같은 열 제거 체인을 따릅니다.
열을 "포집"하는 방법은 여러 가지가 있기 때문에 액체 냉각 기술은 여러 아키텍처로 나타나며, 일부는 점진적(후면 도어 열교환기 등)이고 일부는 구조전환적(액침 등)입니다. 데이터 센터는 액체 냉각 솔루션을 점진적으로 도입하거나 첫날부터 완전히 액체 냉각을 지원하는 시설을 설계할 수 있습니다.
데이터 센터는 특히 AI 및 HPC를 확장할 때 성능, 경제성 및 위험 관리상의 복합적인 이유로 데이터 센터용 액체 냉각을 채택합니다.
많은 운영자가 특정 시스템 임계값을 넘어서면 공랭식은 점점 더 비실용적이 된다고 보고합니다. 업계의 의견에 따르면 일반적으로 랙당 약 20kW 이상에서 공기에만 의존하는 것의 어려움을 지적하지만, AI 랙은 훨씬 더 높은 범위에 도달할 수 있습니다.2
팬과 기류 인프라는 비용이 발생합니다. 칠러를 고려하기 전에도 공랭식 설계는 점점 더 제한적인 서버 설계를 통해 공기를 밀어내는 데 상당한 전력을 소비하는 경우가 많습니다. 액체 냉각은 아키텍처에 따라 팬 요구 사항을 낮추고 시설이 더 높은 온도 설정에서 실행되도록 도울 수 있습니다.3
구성 요소가 뜨거워지면 스로틀링, 오류가 발생하거나 부스트 동작이 감소할 수 있습니다. 데이터 센터 환경의 액체 냉각은 보다 일관된 흡입구 및 구성 요소 온도를 제공하여 성능을 예측 가능하게 유지하는 데 도움을 줄 수 있습니다.
공간이 제한된 대도시 지역에 구축하거나 오래된 건물을 개조하는 경우, 수냉식 서버는 전체 HVAC 접근 방식을 재구축하지 않고도 최신 컴퓨팅 밀도로 나아가는 방안이 될 수 있습니다.4
데이터 센터의 액체 냉각은 열 제거를 위한 열 전달 매체로 공기에만 전적으로 의존하는 대신 액체를 주요 전달 매체로 사용하는 모든 냉각 방식을 의미합니다.
실제로 대부분의 데이터 센터 구현은 다음 패턴 중 하나를 따릅니다.
AI 성장이 가속화됨에 따라 지속 가능성 제약 조건도 설계 방향에 영향을 미치고 있습니다. 물의 가용성 및 냉각 방법의 절충안은 공개 보고에서 점점 더 눈에 띄게 나타나고 있으며, 운영자는 용량 확장과 함께 폐쇄 루프 및 물 사용량을 줄인 접근 방식을 모색하고 있습니다. 이제 물 사용 효율성(WUE)의 사용을 나타내는 새로운 지표가 추적되고 있습니다.5
후면 도어 열교환기는 랙의 후면 도어를 수냉식 라디에이터로 대체합니다. 뜨거운 배기 공기는 도어를 통과하면서 냉각된 후 실내로 유입됩니다.
가장 적합한 곳
주의해야 할 주요 사항
칩 직접 접촉은 종종 사람들이 데이터 센터 액체 냉각에 대해 기본적으로 떠올리는 방식입니다. 냉각제는 뜨거운 구성 요소(GPU, CPU, SSD)에 부착된 콜드 플레이트를 통해 순환됩니다.
이 범주는 특히 AI 데이터 센터의 액체 냉각에 중요합니다. AI 데이터 센터는 GPU가 열 프로파일의 대부분을 차지하며, 랙 밀도가 기존 설계를 훨씬 뛰어넘어 일부는 25만 개에 달하는 GPU를 수용하기도 합니다.6
이것이 매력적인 이유
운영 고려 사항
액침 냉각은 서버 또는 구성 요소를 유전성 유체에 배치합니다. 열은 유체로 직접 전달되며, 그런 다음 열교환기를 통해 냉각됩니다.
팀이 액침을 선택하는 이유
팀이 주저하는 이유
이러한 기술이 주류로 자리 잡음에 따라 ASHRAE 및 산업 지침은 계속 발전하고 있으며, 전력 밀도가 증가함에 따라 신뢰성, 운영성 및 위험 제어를 강조합니다.7
인로우 냉각은 수냉식 장치를 랙 가까이에 배치하여 공기가 이동해야 하는 거리를 줄여 제어력을 향상시킵니다. 이는 일반적인 기존 시설 내의 고밀도 영역에서 종종 사용됩니다.
적합한 분야
많은 최신 설계는 냉각제 분배 장치(CDU)를 사용하여 IT 루프에서 시설 루프를 격리합니다. 이를 통해 제어, 청결도 및 압력 관리를 향상할 수 있으며, 기존 시설의 개조를 더욱 수월하게 만들 수 있습니다.
수냉식 SSD는 단순히 "더 나은 방열판"을 갖춘 SSD가 아닙니다. 이는 핫스왑 유지보수성, 규격화된 장착 및 대규모 유지 관리성 등 엔터프라이즈 스토리지의 운영 기준을 충족하면서 액체 냉각 인터페이스가 열을 효과적으로 제거할 수 있도록 설계된 SSD입니다.
Solidigm은 NVIDIA와 협력하여 핫 스왑 기능 및 단면 냉각과 같은 SSD 액체 냉각 문제를 해결했습니다. Solidigm의 완전 수냉식 SSD 솔루션은 단일 콜드 플레이트로 SSD의 양면을 냉각하며 공간 절약 및 손쉬운 유지 관리를 위해 핫스왑이 가능합니다. 이 기술에 대해 여기에서 가장 먼저 자세히 알아보십시오.
공랭식과 액체 냉각은 모두 IT 장비에서 열을 제거하지만, 근본적으로 다른 방식으로 이를 수행합니다. 이 비교를 사용하여 냉각 접근 방식을 밀도, 신뢰성 및 운영 요구 사항에 신속하게 일치시키십시오.
공랭식
액체 냉각
공랭식
액체 냉각
공랭식
액체 냉각
공랭식 스토리지
SSD 액체 냉각
공랭식은 기류 엔지니어링이 이미 운영의 기반이고 랙 밀도가 안정적인 범위 내에 유지되는 환경에 적합한 경향이 있습니다.
액체 냉각은 밀도 목표, AI 성장 또는 플랫폼 로드맵으로 인해 기류가 병목 현상이 되는 환경, 그리고 팀이 실내 수준의 HVAC보다 인프라(루프, 제어, 절차)에 더 가깝게 작동하는 냉각 시스템을 운영할 준비가 된 환경에 적합한 경향이 있습니다.
하이브리드 냉각은 동일한 시설, 행 또는 랙에서 공기 및 액체 접근 방식을 혼합하여 가장 적합한 곳에 각각을 사용합니다.
하이브리드 냉각 시스템은 다음과 같은 경우에 일반적입니다.
하이브리드 설계는 훌륭한 "가교 전략"이 될 수 있지만, 명확한 운영 경계가 필요합니다. 유지 관리 절차, 예비 부품, 모니터링 및 시설 조정을 문서화하고 조정해야 합니다.
AI 서버의 부상은 주요 강제 기능입니다. AI 인프라와 관련된 논평에서는 종종 기존 수준을 훨씬 뛰어넘는 랙 전력 밀도를 언급하며, 일부는 고급 AI 시스템의 극도로 높은 밀도를 보고하기도 합니다.
아키텍처에 따라 액체 냉각은 다음을 수행할 수 있습니다.
액체 냉각은 종종 구성 요소 수준에서 더 엄격한 열 제어를 제공하여 기류 난기류, 케이블 장애물 및 랙 수준의 불일치로 인한 예기치 않은 문제를 줄입니다.
플랫폼이 발전함에 따라 수냉식 SSD 옵션을 통합하면, 특히 서비스 가능성이 보존되는 응집력 있는 시스템 열 전략을 지원할 수 있습니다.
장기적인 효율성 사례가 강력하더라도 액체 냉각 솔루션은 일반적으로 다음을 요구합니다.
시설 팀, IT 팀 및 공급업체는 다음을 위한 공유 절차가 필요합니다.
누출 감지 및 대응
빠른 분리 처리
예방 유지 관리
냉각제 품질 관리
각 시스템에 대한 구성 요소 선택의 정렬
최신 설계는 누출 가능성과 영향을 최소화하기 위해 노력하지만, 엔터프라이즈 팀은 여전히 누출 시나리오를 일급 장애 모드로 취급하고 그에 따라 계획해야 합니다.
액체 냉각은 특히 AI가 랙 밀도, 열 유속 및 인프라 스트레스를 가속화함에 따라 최신 데이터 센터의 핵심 기능이 되고 있습니다. 그러나 진짜 핵심은 "액체가 공기를 대체한다"는 것이 아닙니다. 데이터 센터의 액체 냉각이 가능성을 확장한다는 점입니다. 기존 방식이라면 비실용적이거나 비효율적이었을 더 높은 밀도, 더욱 일관된 성능, 그리고 새로운 플랫폼 설계를 가능하게 합니다.
그리고 AI 팩토리 대화에서 컴퓨팅이 중심이 됨에 따라 스토리지는 액체 냉각으로 전환되고 있습니다. Solidigm™의 고유한 단면 수냉식 SSD 의 도입은 SSD 액체 냉각이 단순한 실험실 개념이 아님을 시사합니다. 그것은 차세대 고밀도 AI 지원 인프라를 구축하기 위한 툴킷의 일부가 되고 있습니다.
데이터 센터는 랙 밀도와 열 출력이 기류가 효율적이고 안정적으로 처리할 수 있는 범위를 초과할 때 액체 냉각이 필요합니다. 많은 운영자는 랙당 ~20kW를 초과하면 공랭식 설계만으로는 점점 더 어려워진다는 것을 발견하며, AI 랙은 이보다 훨씬 높을 수 있습니다.
칩 직접 접촉은 콜드 플레이트를 사용하여 특정 구성 요소(GPU, CPU 및 SSD 등)에서 열을 흡수하는 반면, 액침은 서버나 구성 요소를 유전성 유체에 담급니다. 액침은 대량의 열을 제거할 수 있지만 종종 더 큰 운영상의 변화가 필요합니다.
아니요. 오늘날 AI 데이터 센터용 액체 냉각이 주요 원동력이지만, 열과 공간이 제약 조건이 될 때 고밀도 데이터베이스, 분석 클러스터 및 HPC 환경도 액체 기반 접근 방식의 이점을 얻습니다.
수냉식 서버 랙은 실내 공기에만 의존하지 않고 액체로 열을 제거할 수 있도록 후면 도어 열교환기, 인로우 냉각기 또는 CDU에 연결된 매니폴드와 같은액체 냉각 인프라와 인터페이스하도록 설계된 랙입니다.
수냉식 SSD는 예측 가능한 맞춤 및 서비스 가능성과 같은 데이터 센터 요구 사항을 유지하면서 열을 수냉식 인터페이스(종종 콜드 플레이트)로 효율적으로 전달하도록 설계되었습니다. Solidigm은 효과적인 액체 열 제거를 가능하게 하면서 핫스왑 동작을 보존하는 설계를 갖추고 있습니다.
고성능 환경에서 NVMe SSD는 특히 액체 최적화 서버에서 기류가 감소할 때 무시할 수 없는 수준의 열을 발생시킬 수 있습니다. SSD 액체 냉각은 성능을 안정적으로 유지하고 더 고밀도의 플랫폼 설계를 지원하는 데 도움이 됩니다.
하이브리드 냉각은 동일한 환경에서 공기 및 액체 방식을 결합합니다. 예를 들어, AI 랙의 GPU/CPU에는 액체를 사용하는 반면 시설의 나머지 부분은 공랭식 상태를 유지합니다. 하이브리드 냉각 시스템은 예산이 제한된 운영에서 가장 현실적인 채택 경로인 경우가 많습니다.
데이터 센터의 물 사용량은 설계에 따라 다릅니다. 일부 냉각 시스템, 특히 증발식 접근 방식은 상당한 양의 물을 소비합니다. 다른 시스템은 폐쇄 루프 또는 물 절약형 설계를 강조합니다. 데이터 센터의 물 사용에 대한 조사가 강화됨에 따라 팀은 설계 또는 개보수 프로세스 초기 단계에서 물 및 에너지 절약을 고려해야 합니다.
주요 운영 우려 사항은 누출 관리, 유지 관리 절차, 냉각제 품질 및 공급업체 변동성입니다. 최상의 완화 조치는 단순한 하드웨어 선택이 아니라 전략적 계획, 모니터링, 문서화된 프로세스 및 교육입니다.
칩 직접 접촉 구성 요소, 랙 수준 또는 인로우 도입을 갖춘 하이브리드 모델을 고려하십시오. 전력 밀도, 열 안정성, 팬 에너지 감소 및 유지 관리 영향과 같은 명확한 성공 지표를 정의하십시오. 그런 다음 운영상의 확신이 입증되면 확장하십시오.
Cecily Whiteside는 Solidigm의 Search 및 콘텐츠 전문가입니다. 그녀는 기술, 라이프스타일, 및 건강 웰니스 웹사이트& 및 간행물에 대해 글을 씁니다. Cecily는 여러 잡지에서 편집장으로 일했으며, 미국 및 해외의 다른 잡지에서 작가 및 사진작가로 기고했습니다.
1) https://spectrum.ieee.org/data-center-liquid-cooling
2) https://www.feace.com/single-post/higher-rack-density-requires-liquid-cooled-servers
3) https://blog.equinix.com/blog/2025/10/01/top-3-myths-about-data-center-operating-temperatures/
4) 참조: https://www.solidigm.com/products/technology/edge-ai-seismic-data-processing-immersion-cooling.html
5) https://ambient-enterprises.com/news-insights/why-liquid-cooling-data-center-design-matters/