[HVAC KOREA] AI 데이터센터 설계·냉각기술 조명

  • 등록 2026-05-18
크게보기

설비융합협회 데이터센터 컨퍼런스 개최
AI DC 시대, 냉각·설계 패러다임 변화

 

대한설비융합협회 데이터센터위원회는 5월14일 코엑스 컨퍼런스룸 E5에서 ‘HVAC KOREA 2026’ 컨퍼런스 일환으로 데이터센터 컨퍼런스 ‘AI시대! 데이터센터의 최신 기술동향’ 세미나를 개최했다고 밝혔다.

 

유료세션으로 진행된 2부 행사는 △다이렉트 리퀴드쿨링 △에너지표준 △설계프로세스 등의 주제로 진행됐다. 약 200여명의 업계관계자들이 참여한 가운데 데이터센터 설계의 심도있는 기술동향과 사례들이 공유됐다.

 

컨퍼런스는 △데이터센터 에너지표준: 에너지효율 평가방법 및 사례(조진균 한밭대 교수) △AI기반 데이터센터 건축설계 시 고려사항(유남선 삼우종합건축사사무소 그룹장) △엣지 데이터센터의 설계 프로세스(박배균 하이멕 본부장) △AI 데이터센터 다이렉트 리퀴드쿨링 최신 기술동향(김우경 한국기계연구원 연구원) △데이터센터 열시스템 모델링 및 폐열회수방법론(문주현 국립한밭대학교) △데이터센터 토탈 커미셔닝 프로세스(최형범 하이멕 본부장) △미국 데이터센터 확장의 과제와 시사점(유호선 숭실대학교 교수) 등의 순으로 진행됐다.

 

AI 확산 속 DC 에너지표준 중요성 부각
조진균 한밭대 교수는 ‘데이터센터 에너지표준: 에너지효율 평가방법 및 사례’를 주제로 발표하며 AI 확산과 디지털전환 가속화에 따라 데이터센터 에너지효율 평가체계 구축 필요성이 커지고 있다고 강조했다.

 

조 교수는 “AI를 사용하는 시대가 자연스러워지고 있으며 그 중심에는 데이터센터가 있다”라며 “지금 시점부터는 데이터센터 에너지에 대해 관심을 가져야 할 시기”라고 말했다.

 

데이터센터는 일반건물과는 다른 운영 특성을 가진 만큼 별도의 에너지평가기준이 필요하다. 일반적인 주거용이나 사무용 건물과 데이터센터는 완전히 다른 구조를 가지고 있기 때문에 기존의 사례로 정해진 기준은 데이터센터 적용 시 불합리한 부분이 많이 나타날 수 있다. 데이터센터는 완전히 다른 생태계로 파악할 필요성이 있는 것이다.

 

특히 AI 데이터센터 확대에 따른 전력소비 증가도 주목해야 한다. 국제에너지기구(IEA)에서는 2030년에 데이터센터 전력사용량이 30테라와트 수준에 육박할 것으로 전망하고 있으며 상황에 따라 2배 이상 증가할 수도 있다.

 

조 교수는 “30MW급 데이터센터의 전력밀도는 약 3만세대 공동주택 사용량에 육박하는 수준”이라며 “데이터센터가 빠르게 증가하는 상황에서 새로운 에너지기준 마련이 필요하다”고 강조했다.

 

데이터센터 에너지효율 평가기준으로 ‘ASHRAE STD 90.4 MLC’가 소개됐다.

 

조 교수는 “기존 PUE(Power Usage Effectiveness)지표는 한계가 있으며 PUE는 상대적인 지표인데 현재는 절대적인 지표처럼 사용되고 있다”라며 “운영조건과 IT부하율, 냉각시스템 종류에 따라 결과가 완전히 달라질 수 있다”고 설명했다. 이어 “같은 규모의 데이터센터라도 냉각시스템과 운영조건에 따라 에너지소비 결과는 달라진다”라며 “무조건 PUE 1.2, 1.3이라는 기준만으로 접근하면 불합리한 설계와 운영문제가 발생할 수 있다”고 지적했다. 

 

조 교수는 ASHRAE 90.4에서 제시하는 MLC(Mechanical Load Component) 개념을 중심으로 냉각부문 효율평가가 필요하다고 설명했다. IT부하는 본연의 목적이라 제약하기 어렵지만 냉각과 전력부문은 줄여나갈 수 있는 영역이며 냉각부문이 에너지절감에서 중요한 비중을 차지하기 때문이다.

 

실제 LG전자 냉동기기반 시뮬레이션 사례도 소개됐다. 기후특성과 냉동기 효율에 따라 같은 시스템도 결과가 달라질 수 있으며 기후가 반영된 지표로 기준 설정이 필요하다.

 

조 교수는 “전통적인 공조회사 외에도 다양한 기업들이 데이터센터시장에 진입하고 있으며 주택시장 침체 이후 건설업계도 데이터센터를 새로운 대안시장으로 보고 있다”라며 “현재는 공랭식비중이 높지만 AI 기술발전에 따라 액침냉각 등 새로운 방식 전환 가능성도 대비해야 한다”고 강조했다.

 

AI DC, 건축설계 패러다임 변화 시발점
유남선 삼우종합건축사사무소 그룹장은 ‘AI기반 데이터센터 건축설계 시 고려사항’을 주제로 AI 데이터센터 확산에 따라 기존 데이터센터와는 다른 건축·설비 통합설계 접근이 필요하다고 강조했다.

 

유 그룹장은 “기존 40kW 수준 데이터센터와 초고집적 AI 데이터센터는 분명한 차이가 있다”라며 “80kW 이상, 향후에는 130kW 이상까지 목표로 하는 AI 데이터센터가 등장하면서 건축에 영향을 미칠 정도의 변화가 발생하고 있다”고 말했다.

 

최근 통과된 인공지능 관련 법안과 데이터센터 인허가 변화 가능성도 언급됐다. 인공지능 데이터센터사업을 추진하기 위해서는 시행령과 인허가 관련 내용을 주의 깊게 봐야 할 필요가 있다. 전력 계통영향평가 면제와 관련된 내용들도 포함돼 있다.

 

AI 데이터센터와 일반 클라우드 데이터센터의 차이도 소개됐다. AI 데이터센터는 학습과 추론 중심 구조로 운영되며 액체냉각이 필수적인 기준으로 자리잡는 추세다. 특히 GPU서버 고집적화에 따른 건축적 영향도 주목해야 한다. 예전 12~15kW급 클라우드 데이터센터는 일부 조정만으로 대응 가능했지만 80~100kW급 이상으로 넘어가면 건축과 설비 측면에서 새로운 대응이 준비돼야 한다.

 

유 그룹장은 “기존에는 랙 같은 ICT장비를 IT공사 영역으로 봤지만 지금은 기반시설과 ICT 장비를 함께 고려하지 않으면 안 되는 상황에 도달했다”라며 “공간만 냉각해서는 AI 데이터센터 운영이 어려운 시대가 됐다”고 말했다.

 

데이터센터 설계 초기단계에서 엔드유저 요구사항도 중요하다. 리퀴드쿨링 비율과 에어쿨링 비율에 따라 설비용량과 옥상장비 구성이 모두 달라진다. 이 때문에 초기 엔드유저 결정이 건축설계와 운영에 굉장히 큰 영향을 미친다.

 

최근 적용되는 ‘룸 레디(Room Ready)’ 개념도 소개됐다. 랙 자체에서 대부분 냉각을 처리하고 룸 전체는 최소 수준 냉방만 수행하는 방식이다. 이상적으로는 항온항습기가 필요 없는 구조까지 가능하다.

 

유 그룹장은 “다만 액체냉각 확대에 따른 건축적 부담도 고려할 필요가 있는데 기존에는 상부 배관을 가장 경계했지만 이제는 에어쿨링과 리퀴드 분배배관이 모두 들어온다”라며 “천장부 배관 증가가 건축물 구조와 유지관리 측면에 큰 영향을 미치게 된다”고 말했다.

 

AI 데이터센터의 냉각비율 변화가 공간구성에도 영향을 준다는 점도 언급됐다. 예를 들어 100kW급 랙에서 9대1 수준의 액체·공랭 비율만 적용해도 상당한 에어쿨링 부하가 발생할 수 있다. 이 때문에 기존에는 무시할 수 있었던 배관과 설비 간섭이 이제는 필수적으로 고려해야 한다.

 

유 그룹장은 “AI 데이터센터는 층수 감소로 일부 면적은 줄어들 수 있지만 구조하중 증가와 층고 상승 등으로 비용상승 요소도 존재한다”라며 “설계를 시작해도 준공 시점에는 IT장비가 달라질 가능성이 크고 기술변화 속도가 빠른 만큼 초기 설계단계에서 충분한 여유공간과 확장성을 고려해야 한다”고 강조했다.

 

엣지 데이터센터, 용도중심 설계 중요
박배균 하이멕 본부장은 ‘엣지 데이터센터의 설계 프로세스’를 주제로 AI·5G·IoT 확산에 따라용도맞춤형 엣지 데이터센터 설계중요성이 커지고 있다고 강조했다.

 

박 본부장은 “엣지 데이터센터는 사용자 또는 데이터 발생지점에 근접해 설치하는 소규모 분산형 데이터센터”라며 “지연시간 최소화와 실시간 데이터처리를 주요 목적으로 구축되는 데이터센터이며 5G·IoT·자율주행·스마트팩토리 등 초저지연 서비스 수요증가에 따라 앞으로 엣지 데이터센터 구축이 계속 확대될 것”이라고 말했다.

 

엣지 데이터센터는 하이퍼스케일 데이터센터와 달리 서비스 요구지역 내에 설치되며 빠른 구축기간과 원격 운영체계를 특징으로 한다. 10MW 이하 소규모 형태가 많지만 단순 용량보다는 데이터를 어떻게 처리하느냐에 따라 엣지 데이터센터 여부가 결정된다.

 

특히 엣지 데이터센터는 빠른 서비스 개시와 수익창출이 목적이기 때문에 빠른 구축이 중요하다. 사업착수 후 1년 이내 구축을 일반적인 목표로 삼는다. 이를 위해 모듈형 설비와 OSC(Off Site Construction)공법 적용사례가 증가하는 추세다. 또한 전담인력이 상주하지 않아도 되도록 원격감시와 원격제어 기반 운영구조를 구축하는 경우가 많아지고 있다.

 

박 본부장은 “엣지 데이터센터 설계프로세스와 관련해서는 발주자의 목표설정이 중요하며 AI 서비스인지, 5G 통신 지연 최소화인지, 금융서비스 대응인지 목적에 따라 구축 결과물이 완전히 달라진다”라며 “발주자가 확고한 목표를 가지고 접근하는 것이 가장 중요하다”고 설명했다.

 

설계단계는 계획설계·기본설계·실시설계 등 3단계로 구성된다. 계획설계단계에서는 사이트 선정과 전력·통신·수도 공급여부가 가장 중요한 요소이며 물 사용이 가능한 지역인지 여부에 따라 냉각시스템 접근방식도 달라진다. 도입하는 랙의 전력밀도에 따라 냉각방식도 달라진다. 저밀도는 공랭식, 고밀도는 Direct-to-Chip(D2C) 또는 액침냉각방식으로 접근할 수 있다.

 

기본설계단계에서는 일반적으로 △인프라 공급 다이어그램과 주요 장비배치 △PUE 분석 △CFD 검증 등이 수행된다. PUE를 사전에 검증해 IT로드를 어디까지 수용가능한지 판단하는 과정이다. 실시설계단계에서는 BIM기반 검증이 필요하다. BIM을 통해 설계도서를 전환하고 인터페이스검토를 통해 시공문제가 있는지 판단해야 한다. 

 

도심형 엣지 데이터센터의 공간제약 문제도 언급됐다. 도심형 엣지 데이터센터는 예상보다 바닥면적이 넓지않아 공랭식만으로 설계하기 어려운 경우가 많다. 이 때문에 옥상에 칠러(WCC)를 설치하는 사례도 있다.

 

박 본부장은 “AI 데이터센터 특별법 시행에 따라 원스톱 인허가 체계도입으로 전체 인허가 기간이 크게 단축될 것”이라며 “기존 DC를 AI 데이터센터로 전환하는 리뉴얼시장도 활성화될 것으로 기대하고 있다”고 말했다. 이어 “과거처럼 완벽한 설계를 통한 방식보다 빠른 준공과 빠른 연산개시를 통해 수익을 창출하는 방향으로 시장이 변할 것”이라고 전망했다.

 

AI DC, 액체냉각기술 진화
김우경 한국기계연구원 연구원은 ‘AI 데이터센터 Direct Liquid Cooling 최신 기술동향’을 주제로 AI 데이터센터의 고집적·고발열화에 대응하기 위한 액체냉각기술 중요성을 강조했다.

 

김 연구원은 “생성형 AI가 빠른 속도로 발전하면서 데이터량이 폭발적으로 증가하고 있다”라며 “데이터센터는 고집적·고밀도·고발열화가 빠르게 진행되고 있다”고 설명했다.

 

데이터센터 전력사용량은 빠르게 증가하고 있다. 국제에너지기구(IEA)에 따르면 데이터센터 전력소모량이 단일 국가수준을 초과하게 됐으며 AI 데이터센터기업인 ‘xAI’ 사례가 소개됐다. xAI의 콜로서스데이터센터는 전력수급 문제로 가스터빈까지 활용하고 있는 상황이다.

 

데이터센터 효율지표인 PUE(Power Usage Effectiveness)도 언급됐다. 현재 글로벌 평균PUE는 약 1.2 수준이다. 냉방·공조가 차지하는 비율은 약 30% 정도이기 때문에 서버 냉각기술 중요성이 커지고 있는 추세다.

 

최근 데이터센터 냉각방식은 데이터센터 랙당 열량이 증가하면서 점차 액체냉각 형태로 바뀌고 있다. 대표적인 액체냉각기술로 △싱글페이즈 Immersion Cooling △투페이즈 Immersion Cooling △Direct-to-Chip(D2C) 방식 등이 소개됐다. 이중 DTC방식은 서버칩에 직접 냉각플레이트를 접촉시키는 구조다.

 

김 연구원은 “실제로 적용이 가장 많이 되고 있는 것은 싱글페이즈 DTC 방식”이라며 “대표적으로 슈퍼마이크로의 GB200 NVL72 제품은 약 250kW급 냉각용량을 적용하고 있으며 xAI 데이터센터에도 설치된 것으로 알려져 있다”고 설명했다.

 

AI GPU 발열 증가에 따른 열관리 한계도 주요하게 다뤄졌다. 최근 GPU의 발열밀도가 급격히 증가하고 있으며 루빈(Rubin) 제품은 100W/cm² 수준까지 올라가고 있다. 이는 물을 끓일 수 있는 정도 수준에 달한다.

 

김 연구원은 “고온운전 전략도 고려되고 있는데 냉각수 온도를 약 45℃ 수준까지 높이면 워터칠러가 필요하지 않을 수 있다”라며 “드라이쿨러만 활용하는 고효율 데이터센터개념이 제안되고 있다”고 말했다.

 

싱글페이즈 DTC의 한계로는 칩 내부 온도편차 문제가 제시됐다. 센서블 냉각방식 특성상 칩 내부에서 유체온도가 상승하면서 온도 불균일 문제가 발생할 수 있다. 이를 해결하기 위한 기술로는 ‘매니폴드 마이크로채널’ 기술이 소개됐다. 기존 2D 마이크로채널 구조에 수직 유동구조를 추가해 3D 형태로 냉각을 구현하는 방식이다.

 

칩에 직접 냉각구조를 형성하는 ‘임베디드 쿨링(Embedded Cooling)’ 기술도 언급됐다. TIM과 히트싱크 등 열저항 요소를 제거해 성능을 크게 향상시킬 수 있는 기술이다. 다만 반도체 제조사와의 협업 및 안정성 문제가 남아 있는 상황이다.

 

김 연구원은 “아직까지는 작은 스케일의 데이터센터부터 대규모 시스템까지 아직 해결해야 할 과제가 많다”라며 “냉각기술뿐만 아니라 표준화와 전력수급 문제까지 앞으로 함께 고민해 나가야 할 시점”이라고 강조했다. 

 

흡착식 히트펌프, PUE 1.1 미만 달성

문주현 한밭대 교수는 ‘데이터센터 에너지표준: 에너지효율 평가방법 및 사례’를 주제로 발표하며 AI 확산과 디지털전환 가속화에 따라 데이터센터 에너지효율 평가체계 구축 필요성이 커지고 있다고 강조했다.

 

특히 데이터센터의 냉각폐열을 흡착식 히트펌프로 회수해 PUE(전력사용효율)를 1.1 미만으로 낮출 수 있다는 연구 결과를 발표했다. 문 교수는 설비공학회 데이터센터 전문위원회 학술위원으로 활동 중이며 데이터센터 열시스템의 1차원 축소 모델링 기법과 폐열 활용을 통한 최적 설계 방법론을 논문 기반으로 설명했다.

 

문 교수는 "냉각이 잘 되면 될수록 좋다는 관점은 기계공학적 시각"이라며 "데이터센터 전체 관점에서는 PUE를 낮추는 것이 핵심"이라고 강조했다.

 

특히 냉각과정에서 발생하는 폐열의 온도수준, 즉 열역학적 '엑서지(exergy)' 품질에 주목해야 한다. 액침냉각시스템의 경우 냉각수 출구온도를 최대 50~60°C까지 끌어올릴 수 있으며 이 온도대의 폐열은 충분한 엑서지 가치를 가진다. 중국 연구자들의 논문에서도 약 54°C 수준의 폐열을 활용하는 연구가 활발히 이뤄지고 있다.

 

폐열 활용기술로는 흡착식 히트펌프와 흡수식 냉동기 두 가지를 비교 검토했다. 흡착식 히트펌프는 COP(성능계수)가 0.4~0.65 수준으로 흡수식보다 낮지만 50~60°C의 낮은 온도대에서도 작동할 수 있어 액침냉각 데이터센터에 더 적합하다.

 

구체적인 시나리오로는 200kW 규모의 액침냉각탱크에서 약 35~55kW의 폐열을 회수해 흡착식 히트펌프에 공급할 경우 추가 냉열생성을 통해 PUE를 기존 액체냉각 수준인 1.2에서 1.04~1.1 미만까지 낮출 수 있다고 설명했다. 흡착제 소재로는 기존 실리카겔 외에 MOF(Metal-Organic Framework) 계열 신소재를 주목했다. MOF 기반 흡착제는 흡착성능이 우수하고 반복사용에도 내구성이 높아 장기운용에 유리하다.

 

시스템 해석 방법론으로는 CFD기반 고차원 수치해석 대신 에너지·질량·모멘텀 보존 방정식에 기반한 1차원 물리모델(화이트박스 모델)을 채택했다. 딥러닝이나 순수 신경망(블랙박스 모델)만으로는 시스템 거동을 파악하기 어려워 설계 신뢰성이 떨어진다는 이유에서다. 최적설계에는 PSO(입자군집최적화) 알고리즘을 적용해 다수의 독립변수를 동시에 고려하면서 전체 시스템의 최적 설계점을 탐색했다.

 

문 교수는 "단순 수렴에 그치지 않고 카오스 이론을 접목해 로컬 미니마에 빠지지 않도록 알고리즘을 보완했다"라며 “실험결과와의 오차는 평균 7% 이내로 확인됐으며 흡착·탈착 방정식을 적용해 4종의 흡착제 물성을 반영하고 150여개의 설계변수 중 주요 30개를 선별해 민감도 분석을 수행했다”고 밝혔다.

 

이어 “50~60°C 수준의 폐열을 지역난방이나 주거시설에 직접 공급하는 방식은 열손실과 민원 문제 등으로 현실성이 낮다”라며 “폐열을 데이터센터 부지 내에서 재처리해 냉열로 전환하는 방식이 현실적인 접근”이라고 강조했다.

 

또한 "PUE 1.1 미만을 달성하려면 액체냉각만으로는 한계가 있으며 폐열활용기술이 사실상 유일한 현실적 해법으로 향후 실증 검증을 통해 최적설계 결과의 정확도를 높여나갈 계획“이라고 밝혔다.

 

AI DC, 단품검증에서 시스템 검증으로 전환해야

최형범 하이멕 본부장은 ‘데이터센터 토탈 커미셔닝 프로세스’를 주제로 AI 데이터센터의 신뢰성 확보를 위해 기획 단계부터 인수인계까지 전 주기를 아우르는 토탈 커미셔닝 프로세스의 필요성을 발표했다.

 

최근 GPU서버 도입으로 인한 전력밀도 급증, 고조파(harmonic) 발생에 따른 전력품질 저하, 공냉방식 한계로 인한 수냉·액침냉각으로의 전환이라는 세 가지 변화가 AI 데이터센터 환경을 근본적으로 바꾸고 있다.

 

최 본부장은 "일반 데이터센터가 한 명의 작업자가 문제를 해결하는 구조라면 AI 데이터센터는 다수의 작업자가 공동으로 해결하는 구조"라며 ”단품 위주의 검증방식으로는 AI 데이터센터의 복잡한 시스템 신뢰성을 담보하기 어렵다“고 지적했다.

 

토탈 커미셔닝은 발주처의 요구사항 파악부터 시작해 설계검토, 시공, 단계별 검증, 종합 시운전, 인수인계까지 전 과정을 체계적으로 관리하는 총괄 활동이다. 초기 레벨단계에서는 설계 도서의 정합성 검토, 인터록 및 시퀀스 검증이 핵심이며 레벨 5에 해당하는 종합 시운전 단계에서는 실제로 발생하지 않았더라도 발생 가능한 장애 시나리오를 설정해 UPS, 발전기, ATS(자동절체스위치), STS(정적절체스위치) 등 전체 계통을 통합 시험한다.

 

전력품질과 관련해서는 세그(SAG, 순간전압강하)와 고조파 왜곡(THD) 문제를 집중적으로 다뤘다. 세그 발생 시 허용 가능한 절체시간은 2사이클(약 33ms) 이내로 이를 초과하면 서버가 다운될 수 있다.

 

최 본부장은 "20~30년 전 일본에서 고조파 문제로 전체 시스템이 정지돼 대규모 금전적 손실이 발생한 사례가 있었다"라며 ”고조파 왜곡은 변압기 용량 저하, 중성선 과부하로 인한 발열, 화재 위험으로 이어질 수 있으며 대응책으로는 액티브 필터 적용이 있다“고 제시했다.

 

냉각계통 이중화 문제도 중요하게 다뤄졌다. 냉각시스템이 정지될 경우 서버온도는 초당 1.5~3°C씩 급상승해 약 10초 내에 45°C에 도달하며 30초가 경과하면 열폭주상태로 전환될 수 있다. 이를 해결하기 위해서는 전원 이중화 및 EPS(비상전원공급장치)의 적정 용량 확보와 함께 ITIC 기준에 부합하는 제품을 적용해야 한다.

 

운영전환 및 사후관리측면에서는 준공 이후 2~3년 주기의 재커미셔닝을 통해 기존 측정값과 현재 상태를 비교·분석하는 것이 중요하다. 아시아 일부지역에서는 5년 주기로 재커미셔닝을 시행하는 사례도 있다.

 

최 본부장은 ”토탈 커미셔닝 도입으로 결함 사전발견율 약 70%, 운영중단 가능성 절감 약 85%, 냉각시설 효율 개선 및 전력품질 개선 적용 시 에너지비용 최대 30% 절감이 가능하다“라며 ”경제성 측면에서는 투자회수기간 18개월, 투자수익률(ROI) 약 2.5배, 연간유지비 절감 약 35%의 효과가 있다“고 밝혔다.

 

이어 ”전력배전계통과 냉각계통을 함께 검증하며 부정합을 제거하는 것이 필수 조건"이라며 "발주처의 요구 사항을 명확히 인지한 상태에서 통합조정체계를 구현하고 종합시스템 실증을 거쳐야 한다"고 강조했다.

김정현, 이지완 기자 jwlee@kharn.kr
저작권자 2015.10.01 ⓒ Kharn



  • youtube
  • facebook