반도체장비 전문기업인 PKI(대표 박광식)가 최근 데이터센터(DC) 핵심인프라로 주목받고 있는 리퀴드쿨링으로 사업영역을 확장했다. 액체냉각분야 글로벌리더인 리퀴드스택(Liquid Stack) 국내 총판으로 DLC(Direct Liquid Cooling) CDU(Coolant Distribution Unit) 및 2상(2 Phase) 액침냉각(Immersion Cooling) 등 장비를 공급하고 있다.
반도체분야 전문가로서 DC쿨링분야에 필수적인 GPU 등 컴퓨팅칩에 대한 높은 이해도를 바탕으로 지난 10여년간 국내 DC 리퀴드쿨링시장을 준비해 온 박광식 PKI 대표에게 사업전략과 시장·기술동향에 대해 들었다.
■ DC 리퀴드쿨링분야로 사업을 확대했는데
PKI는 반도체 및 디스플레이 장비·부품 제조와 유통분야에서 오랜 경험을 축적해오며 토탈솔루션 프로바이더로서 입지를 다져왔다. 특히 에치(Etch)공정용 칠러쿨런트 등 반도체·디스플레이 제조용 케미컬을 안정적으로 공급해오며 소재와 장비 양 분야에 걸친 기술전문성을 확보하고 있다.
최근 AI DC 고발열 문제는 기존 공조설비로는 대응이 어려운 수준으로 리퀴드쿨링기술은 선택이 아닌 필수 인프라로 부각되고 있다. PKI는 그동안 축적한 열관리 기술과 케미컬 및 장비 관련 노하우를 바탕으로 AI DC 환경에 최적화된 리퀴드쿨링 솔루션을 제공한다. 단순한 냉각장비 공급을 넘어 시스템 운영안정성과 유지보수 효율성까지 고려한 통합형 솔루션을 통해 고객에게 차별화된 가치를 제공한다.
■ 중장기 전략 및 주력시장은
리퀴드쿨링사업을 단순한 냉각기술 공급을 넘어 초고발열 AI시스템에 최적화된 AI 인프라 설계파트너로 발전시키고 있다. 단기적으로는 DLC가 본격 도입되는 추세이며 중장기적으로는 2상 액침냉각(2PIC) 기술로의 전환을 전망하고 있다. 특히 GPU 및 HBM 기반의 고발열 아키텍처가 주류로 자리잡으면서 랙부터 클러스터까지 단위의 리퀴드쿨링 턴키 공급체계를 확보하는 것이 핵심 전략이다. 이와 함께 서버개조, 냉매취급, 모니터링시스템까지 통합 제공함으로써 고객의 다양한 요구에 대응하고 있다.
주력 시장은 AI HPC DC, 토큰(Token) 생산공장 개념의 AI팩토리, 엣지DC시장 등이 있으며 특히 100~600kW 이상의 랙전력수요 전망에 따라 리퀴드쿨링은 고성능 AI인프라 필수기술로 부상하고 있다.
■ 리퀴드스택 솔루션은
리퀴드스택은 고발열 AI인프라에 최적화된 리퀴드쿨링 전용장비를 제공하며 고객 냉각수요에 따라 DLC와 액침냉각 두 가지 방식을 모두 지원한다. DLC용 솔루션으로는 고성능 CDU를 공급하고 있으며 1MW급 CDU를 기본으로 최대 10MW까지 확장 가능한 GigaModular™ 시스템도 지원한다. 해당 시스템은 랙단위로 유량과 온도를 정밀하게 제어할 수 있도록 설계돼 고효율·고신뢰 냉각 환경을 구현한다.
액침냉각분야에서는 단상과 2상방식을 모두 상용화한 세계 유일의 기술기업으로 특히 2상 액침냉각기술은 냉매가 서버 구성요소에 직접 접촉해 기화·응축사이클을 통해 고효율 냉각을 구현한다.
이 솔루션은 탱크당 최대 252kW까지 냉각이 가능하며 고발열 GPU 및 HBM 기반 AI HPC환경에 최적화돼 있다. 해당 장비는 고신뢰 설계, 유지관리 편의성, 기밀성 확보로 냉매의 공기 중 배출을 최소화해 DC운영 안정성과 지속가능성을 보장한다.
■ 구체적인 성능수치는
DLC 대표모델인 CDU-1MW는 최대 1,350kW의 냉각 용량을 제공하며 NVIDIA 공식 벤더리스트에 등재돼 있다. 또한 N+1 이중화 펌프·필터, PLC 기반 자동 제어 시스템을 탑재해 높은 신뢰성과 유지관리 편의성을 확보했으며, ETL, CSA, CE 등의 주요 인증을 모두 취득한 제품이다. 고온수 기반 운전이 가능해 기존 DC대비 냉각에너지 사용을 36% 이상 절감할 수 있다.
대규모 AI DC를 위한 GigaModular™ CDU-10MW는 모듈형 아키텍처를 통해 2.5MW에서 최대 10MW까지 확장 가능한 모듈형 구조로 설계돼 있으며 전면 접근식 구조로 벽면 밀착 설치가 가능해 설치 효율성을 극대화할 수 있다. 중앙집중 제어기능을 통해 설치공간 및 구축비용을 최대 25%까지 절감할 수 있다. 모듈당 3,600LPM의 유량 처리 성능과 50℃ 고온환경에서도 안정적인 운전이 가능해 극한 조건에서도 높은 가용성과 에너지효율을 유지할 수 있는 하이퍼스케일 솔루션이다.
2상 액침냉각 대표 제품인 DataTank™ 48U는 상면 최대 69% 절감, 냉각에너지 41% 절감, CAPEX 44% 절감, TCO 15% 개선 등 탁월한 경제성을 제공한다. 특히 PUE 1.02~1.03 수준으로 업계 최고수준의 에너지효율을 실현한다.
DataTank™ 4U는 소형폼팩터 환경 및 PoC, 연구개발용 테스트 환경에 적합한 제품으로 내장형 라디에이터를 통해 별도의 배관없이 독립운용이 가능하며 전시·쇼케이스용 구성에 적합하다.
유지관리 측면에서 2PIC시스템의 연간 냉매손실률은 일반적으로 2% 이하이며 완전 밀폐 및 정압운전 시 손실률은 0.1% 미만으로 안정적으로 관리된다. 또한 해당 시스템은 물소비량이 극히 적고 GWP 10 이하의 HFO계열 친환경 냉매를 활용함으로써 기존 공랭대비 95% 이상 탄소배출량 절감효과도 기대할 수 있다.
■ 최근 DC업계 글로벌트렌드는
최근 AI인프라 산업을 좌우하는 엔비디아(NVIDIA)가 AI팩토리 개념을 제시했다. 이는 기존 DC를 단순한 고성능 연산시설이 아닌 AI모델과 디지털 토큰을 대량 생산하는 산업형 생산라인으로 재정의하는 것이다. 이 개념은 DC를 ‘공장’에, GPU를 ‘생산 장비’에, 생성된 텍스트·이미지·음성·코드 등을 ‘디지털 토큰(Token)’에 비유하며 결과적으로 이러한 토큰이 API 과금, 구독모델, 광고, 생성콘텐츠 등 경제적 가치로 환산된다는 점에서 기존 인프라의 역할과 지표를 근본적으로 전환하고 있다.
이러한 변화는 새로운 AI 경제체계, 즉 AI 토크노믹스(Tokenomics) 실현을 위한 전제조건으로 작용한다. 토크노믹스 관점에서는 GPU·HBM 기반의 대규모 병렬처리 능력은 물론 동일한 전력·면적·설비조건에서 얼마나 많은 유효토큰을 빠르고 안정적으로 생산할 수 있는지가 인프라 경쟁력의 핵심지표이다. 이에 따라 DC는 기존의 ‘연산성능’ 중심에서 ‘토큰 생산효율’을 중심으로 설계돼야 하는 구조적 전환을 요구받고 있다.
이 패러다임 전환은 인프라 전반에 영향을 미친다. 냉각기술은 단순한 열관리 장비가 아니라 토큰생산성을 좌우하는 핵심 설계요소로 격상되며 전력인프라는 고밀도 전력분배 구조로 진화해야 한다. 서버와 랙 구성 역시 GPU 메모리 간 병목을 최소화하고 발열집중 구간에 효율적으로 대응할 수 있도록 모듈형·리퀴드 중심설계가 요구되며 인프라효율성 지표역시 기존 PUE(Power Usage Effectiveness)에서 벗어나 AI작업에 특화된 pPUE(partial PUE) 개념으로 전환되고 있다.
이러한 흐름 속에서 PKI는 AI팩토리를 단순한 HPC 클러스터가 아닌 AI라는 새로운 디지털 자산을 생산하고 유통하는 공장형 인프라로 해석하고 있다. 이에 따라 냉각기술 또한 기존과는 다른 위상으로 접근하고 있으며 AI 토크노믹스 실현을 위한 생산 설계요소로 간주하고 있다.
이를 위한 첫 번째 대응 전략으로 DLC 및 2PIC 기반의 리퀴드쿨링 토탈 솔루션을 제공해 다양한 고객 환경에 유연하게 대응하고 있다. 둘째로는 루빈(Rubin) 및 루빈울트라 세대 이후 등장할 3,600W급 GPU 및 랙당 600kW 이상 부하환경에 최적화된 설계를 지속적으로 개발 중이다. 셋째로 냉각·전력·제어시스템을 통합한 랙~클러스터 단위 통합플랫폼을 지향하며 마지막으로는 장기운영 기반 PUE 개선과 TCO 최적화설계를 통해 고객의 지속가능한 운영구조를 지원하고 있다.
■ GPU서버 발열 증가에 따른 쿨링시스템 영향은
고밀도 GPU 서버는 랙당 80~100kW 이상 전력소모와 열을 발생시키고 있으며 이 수치는 랙당 1MW 수준까지 증가할 전망이다. 결국 고밀도 GPU서버 열부하는 냉각시스템을 단순 대응이 아닌 사전설계 및 통합관점에서 접근해야 하는 ‘엔지니어링 대상’으로 만들고 있으며 이에 맞춘 냉각기술과 장비진화가 필수적인 상황이다.
먼저 서버설계 자체가 리퀴드쿨링을 전제로 변화하고 있다. CPU, GPU, HBM 등 주요 발열원이 좁은 공간에 밀집되면서 기존 공랭팬으로는 충분한 열제거가 어렵고 리퀴드쿨링을 고려한 구조가 요구된다. 이에 따라 콜드플레이트 부착을 위한 전용 인터페이스, 유체 순환구조, 핫스팟 대응 서멀구조 설계 등이 서버 플랫폼에서 기본 옵션으로 채택되고 있다.
둘째로 랙단위에서 냉각용량의 구조적 확대가 불가피하다. 공랭랙이 보통 10~50kW 수준이었던 것과 달리 고밀도 AI서버는 100kW 이상 냉각이 필요하다. 이에 따라 CDU 용량확대, 이중펌프 및 필터구조, 냉매수용량 증가, 압력손실 최소화 설계 등이 필수로 반영된다.
셋째로 DC 수준에서도 냉각 아키텍처의 전면적인 재설계가 요구된다. 랙단위 개별냉각을 넘어 데이터홀 단위 열제어 설계가 필요해졌으며 이에 맞춰 모듈형 리퀴드쿨링시스템, 중앙제어 방식, AI기반 냉각 최적화기술이 병행돼야 한다.
■ 주요 칩·서버기업 동향에 따른 쿨링시스템 변화는
최근 NVIDIA와 AMD를 비롯한 주요 GPU 및 서버칩셋 기업들은 AI팩토리 시대를 대비한 차세대 아키텍처를 잇따라 발표하고 있다. 특히 NVIDIA는 루빈, 루빈울트라, 파인만(Feynman) 등 아키텍처를 통해 단일 GPU 기준 최대 3,600W TDP, 랙 단위 600kW 이상의 전력소비를 수반하는 초고밀도시스템을 계획하고 있으며 이는 DC설계 전반에 냉각기술의 역할과 위상을 근본적으로 재정의하고 있다. 파인만세대부터는 기존 공랭식은 물론이고 DLC방식으로도 감당이 어려운 수준의 발열밀도에 도달하게 된다. 이에 따라 PKI는는 2상 액침냉각을 기반으로 한 냉각시스템 고도화에 집중하고 있다.
이처럼 냉각기술에 대한 요구는 단순한 고출력 대응이 아니라 서버설계 초기단계부터 랙구성, 배치 알고리즘, 운영효율성까지 통합적으로 고려되는 전방위적 설계요소로 확장되고 있다. PKI는 이러한 변화에 맞춰 수동적 냉각솔루션이 아닌 능동형 인프라기술을 지향하고 있으며 고객이 차세대 AI 워크로드에서도 안정적인 운영과 지속가능한 TCO 구조를 실현할 수 있도록 적극 지원하고자 한다. 냉각은 더 이상 주변장치가 아니다. AI토큰을 대량생산하는 이 시대에 냉각은 GPU와 함께 ‘AI 생산플랫폼’의 핵심 구성요소로 자리잡고 있다. PKI는 이러한 구조적 전환 속에서 선도적인 기술 파트너로서의 역할을 강화해 나가고 있다.
■ 단상 액침냉각의 장점과 한계는
단상 액침냉각(1PIC)은 서버를 비전도성 오일에 완전히 침지시켜 액체가 직접 발열을 흡수하는 방식으로 냉각이 이뤄진다. 구조가 단순하고 설계 및 운용이 간편해 유지보수 측면에서 초기 도입이 쉬운 기술로 평가되고 있으며 특히 엣지나 엔터프라이즈 환경에서 적용 유연성이 높다는 장점이 있다.
다만 PKI는 고발열 AI서버 환경에서는 1PIC 방식이 구조적인 한계를 지닌다고 판단한다. 대표적으로 냉각 효율이 2상 액침냉각대비 낮고 오일 기반 냉각유의 열화가능성, 그리고 냉각액 회수 및 재처리 복잡성이 문제로 지적된다. 최근 GPU 기반 칩발열은 개별 칩 기준으로도 1,000W 이상에 달하고 있으며 이러한 고열을 효과적으로 제어하기 위해서는 냉각효율이 매우 높은 구조가 요구된다.
1PIC 방식은 기본적으로 직렬 유체순환 구조를 채택하는 경우가 많아 하류에서 가열된 유체가 상류칩에 도달하면서 온도상승이 누적되고 상류칩 냉각효율이 급격히 저하되는 문제가 발생할 수 있다.
냉각효율을 개선하기 위해 공급 온도를 13℃ 수준까지 낮추고 별도의 칠러시스템을 도입하는 방식도 고려할 수 있지만 이 경우 전체 시스템의 PUE가 상승하고 칠러설치로 인해 장비설치 면적이 커지며 인프라 구축 및 운영비용 측면에서도 TCO에 부담이 된다.
또한 GPU 통로역할을 하는 HBM과 칩렛(Chiplet) 구조 고도화에 따른 여러 소재의 적층(Stack)화로 유체와의 호환성(Compatibility)은 중요한 과제가 된다. 오일의 경우 고분자화합물로서 장시간 사용에 따른 슬러지 발생 등 이슈가 서버성능에 치명적일 수 있다. 단상유체는 열전도율이 낮고 점도가 높아 유체순환이 어려운 특성을 가지는데 250℃ 이상 비점을 가진 유체개발은 더 낮은 온도의 FWS 공급과 이를 위한 냉각칠러 활용 등으로 더 큰 사이즈와 더 높은 PUE라는 아이러니한 상황에 직면할 수 있다.
즉 고밀도 AI서버 환경에서는 냉각성능과 구조적 한계로 인해 적용에 한계가 있다고 판단하고 있다. 1PIC 기술은 중간수준 발열을 가진 엣지 및 엔터프라이즈용 시스템에는 유효한 옵션으로 평가하고 있다.
그러나 동일 환경에서는 DLC가 냉각효율과 운용안정성 면에서 더 적합한 솔루션이라고 판단한다. 근본적으로 단상 액침냉각이 실질적으로 커버할 수 있는 냉각 용량이 DLC시스템으로도 충분히 대응가능한 수준에 도달하고 있기 때문에 단상방식 액침냉각을 굳이 도입할 필요성은 점차 줄어들고 있다. 이에 따라 냉각 성능·비용·운영 효율성 등을 종합적으로 고려할 때 단상 액침냉각은 DC 냉각방식으로 현실화되기 어렵다고 판단된다.
■ 2상 액침냉각의 냉매 증발손실은
2상 액침냉각 방식은 잠열을 이용해 열전달 효율면에서 가장 진보된 냉각기술로 평가받고 있지만 일부에서는 냉매 증발손실이나 관리비용에 대한 우려가 제기되기도 한다.
이에 대해 리퀴드스택의 탱크는 밀폐압력시스템, 고성능 응축기, 자동 증기회수시스템 등을 통해 냉매 연간손실률을 제로에 가까운 수준으로 유지 가능하다. 저GWP 친환경 냉매사용을 통해 환경성과 안전성도 확보하고 있다. 운영비용 측면에서는 팬이나 펌프가 필요 없는 패시브시스템 구조덕분에 냉각 자체 에너지소비가 현저히 낮고 DC의 고온수 운영이 가능하다는 특성을 고려하면 TCO 관점에서 오히려 공랭이나 DLC, 1PIC 대비 비용절감 효과가 크다.
결과적으로 냉매손실 문제는 기술적으로 충분히 제어 가능한 부분이며 전체 시스템효율, 에너지 절감, 공간절약, 운영비 절감 측면에서 2상 냉각은 단점을 상쇄하고도 남을 수준의 구조적 장점을 가진 기술이다.
■ PFAS 규제에 대한 리스크는
최근 유럽연합(EU)을 중심으로 PFAS(과불화화합물)에 대한 규제가 강화되는 흐름 속에서 2023년 2월 독일, 네덜란드, 노르웨이 등 5개국이 유럽화학물질청(ECHA)에 PFAS 사용금지를 공식 제안한 바 있다. 현재 이 제안은 EU REACH 규제 개정안의 드래프트(Draft)로 검토되고 있으며 아직 최종 확정된 규제는 아니다. 향후 실제로 어떤 형태의 규제가 마련될지는 아직 명확하지 않으며 내용과 범위는 유럽위원회의 입법절차에 따라 진행될 예정이다.
최근 EU를 중심으로 PFAS에 대한 규제 움직임이 있는 것은 사실이지만 대체물질 개발을 전제로 하고 있어 장기간 소요될 것으로 전망한다. 그러나 3M이 PFAS-out을 선언한 시장에 차세대 불소계 냉매개발 분야는 중국기업들을 중심으로 복제해 시장진출을 하고 있으며 기존 글로벌기업들은 반도체용으로 non-PFAS 제품을 개발하고 있는 상황이다.
액침냉각분야에서는 하니웰, 솔베이, 다이킨 등이 새롭게 제품개발을 진행하고 있으며 기존 Chemours는 2P50을 인도에서 양산할 계획이라고 전해지고 있다.
다만 PFAS는 본질적으로 매우 넓은 범위의 유기화합물군을 의미한다. 현재까지 규제 대상은 PFOA, PFOS 등 전통적인(legacy) PFAS에 한정돼 있으며 HFO 기반 냉매는 현행 규제목록에 포함되지 않았다. 당사가 사용 중인 HFO 계열의 Opteon™ 2P50 제품은 케무어스(Chemours)가 개발한 차세대 유전체 유체로 ODP(오존층파괴지수), GWP(지구온난화지수) 저감설계 및 회수·재사용 가능성을 특징으로 하며 PFAS 규제 대상이 아닌 물질군에 속한다.
■ 국내 리퀴드쿨링 시장동향은
국내에서도 AI 연산수요와 전력효율화 요구에 따라 리퀴드쿨링기술 도입이 점진적으로 확대되고 있다.
대표적인 사례로 LG는 평촌 R&D 캠퍼스 내 AI 전용 클러스터에 DLC기반 고발열 서버환경을 구축하고 일부 실증테스트를 완료했다. 이와 함께 DLC인프라를 수용할 수 있는 신규 DC가 국내에 건립됐으며 현재 해당인프라에 적합한 고객유치를 추진 중인 것으로 확인된다.
아직 하드웨어 단계부터 리퀴드쿨링을 고려한 설계사례는 드물지만 이러한 시도가 국내 리퀴드쿨링 상용화의 중요한 전환점이 될 것으로 기대된다. PKI는 주요기업 및 연구기관과 협력해 2상 액침냉각시스템을 실제환경에 시범운용·검증 중이며 고성능 GPU서버 중심 냉각효율성과 안정성을 실증하고 있다.
국내에서도 AI 서버수요 확대와 전력 밀도 증가에 따라 DC운영사, 서버 OEM, 설계·엔지니어링사 등 다양한 수요자들이 리퀴드쿨링기술 필요성과 잠재력에 공감하고 있으며 실제 PoC 및 상업적 검토도 꾸준히 증가하고 있다.
리퀴드쿨링은 이제 단순한 선택지가 아니라 고발열 서버인프라의 현실적 전환 대상으로 인식되고 있다.
다만 실질적 시장 확산을 가로막는 한계도 분명한다. 첫째로는 국내 레퍼런스 부족이다. 상용화된 구축사례나 장기 운용데이터가 부족해 기술안정성, 운영신뢰성, TCO 절감효과에 대한 실증적 검증이 미흡하다는 점에서 도입을 주저하는 경향이 강하다.
둘째로 전력수급 병목이다. 수도권과 주요 산업벨트에서는 신규 전력인입이 수년 단위로 지연되고 있으며 이는 설비투자를 결정하는 기업들에게 심각한 불확실성을 야기한다.
셋째로 고성능 GPU장비 확보의 불확실성이다. 글로벌 GPU 수요폭증으로 수급불균형이 심화되면서 이는 국내 AI인프라 확대 병목요인으로 작용하고 있다. 일본 등 주요국은 정부차원의 조달지원 및 우선배분 정책을 통해 경쟁력을 확보하고 있는 만큼 우리 정부도 GPU 확보를 위한 전략적 개입과 지원책 마련이 절실하다.
■ 국내 DC인프라 구축 특성은
현재 한국은 전력수급 제한과 계통영향평가 제도 영향으로 서울 및 수도권 중심 주요지역에서 대규모 DC설립이 점차 어려워지고 있는 상황이다. AI DC분야는 국가 차원에서 엔비디아 GPU 확보에 제약이 발생하고 있으며 이로 인해 관련 인프라 구축이 전반적으로 더디게 진행되고 있다.
이러한 상황에서 리퀴드쿨링 도입은 PUE 개선을 통해 동일 수전용량 하에서도 더 많은 IT 로드(Load) 확보가 가능하다는 점에서 전략적 대안이 된다.
실제로 국내 모 대기업의 HPC 인프라 구축사례에 따르면 기존 공랭기준 GPU 서버 1만5,000여대가 설치되던 공간에 AI급 GPU 서버 1만6,000여대를 설치했고 PUE는 약 10% 개선돼 4년 이내 ROI를 회복했다.
향후 차세대 기술인 2PIC로 전환해 DC설계부터 운영까지 고려한다면 더 높은 절감효과를 기대할 수 있다.
■ 리퀴드쿨링 고도화 계획은
PKI와 리퀴드스택은 리퀴드쿨링시장의 빠른 성장세에 발맞춰 단기적으로 급격히 증가하는 열부하(heat load)에 대응할 준비를 하고 있다.
특히 DLC 및 2상 액침냉각기술을 중심으로 고발열 AI서버 환경에서 랙밀도 향상을 위한 개발에 집중하고 있다. 이는 고발열 AI서버 환경에서 냉각효율을 극대화하고 전력·공간 제약을 동시에 해결할 수 있는 핵심전략이다.
나아가 AI팩토리나 HBM 기반 서버·칩 구조에 최적화된 냉각솔루션을 사전 설계단계부터 반영하는 협업설계(Co-Design) 방식도 검토하고 있다. 기존 냉각장비가 서버구조와 별개로 설계되던 방식에서 벗어나 초기 제품개발 단계부터 서버사·부품사와 긴밀히 협업해 열관리까지 포함된 통합설계를 구현하는 방향이다.
AI팩토리는 서버, 냉각, 전력, 스토리지 등 다양한 이해관계자가 유기적으로 연결된 복합사업모델이기 때문에 PKI는 리퀴드스택과 함께 서버 제조사, 반도체기업, DC운영사 등 다양한 사업군과의 기술협업을 강화하고 있다. 이를 통해 고객 맞춤형 냉각 아키텍처를 제공하고 고성능·고집적인프라 구축을 위한 미래형 AI DC 표준을 함께 만들어가고자 한다.
■ 고성능 DC쿨링 활성화를 위한 제도개선 방안은
현재 AI인프라 확충은 단순한 하드웨어 조달만으로는 충분하지 않다. GPU를 확보하는 것에서 출발해 이를 효율적으로 운용하기 위한 계획수립, 수요처와의 정교한 매칭, 안정적인 소프트웨어 생태계 조성, 그리고 이를 뒷받침할 전문인력 양성에 이르기까지 전 주기적 통합전략이 유기적으로 작동해야 비로소 실질적인 국가 AI경쟁력으로 이어질 수 있다.
그러나 이러한 전략부재로 인해 이미 구축된 인프라조차 실질적으로 활용되지 못하는 비효율 구조가 고착화되고 있는 것이 현실이다.
이에 민간의 기술개발 및 도입노력과 더불어 정부차원의 정책적 뒷받침이 반드시 병행돼야 한다고 판단한다. 우선 DC 전력수급계획과 GPU 공급정책을 연계한 통합로드맵을 수립할 필요가 있다. 또한 공공 GPU 수요를 체계적으로 예측하고 이에 기반한 운영계획과 플랫폼 매칭체계를 구축함으로써 자원낭비를 줄이고 실질적인 활용도를 높여야 한다.
이와 함께 고밀도 AI 워크로드에 적합한 리퀴드쿨링 인프라로의 전환을 촉진하기 위해 국가차원의 실증사업 확대 및 보조금지원이 필요하다. 이는 에너지효율성뿐만 아니라 물리적 공간과 전력사용 한계를 극복하는 전략적 대안이 될 수 있다.
나아가 GPU, 전력, 소프트웨어 등 각기 분절된 예산항목을 통합적으로 연계하고 이를 유기적으로 집행할 수 있는 구조를 갖추는 것 또한 매우 중요하다.
AI강국으로의 도약을 위해서는 기술뿐만 아니라 이를 뒷받침할 수 있는 정책과 제도, 그리고 인프라전환에 대한 실행력이 뒷받침돼야 한다.