GPU 발열 잡아야 AI 돈 번다…kt cloud, '리퀴드 쿨링'이 답

조인영 기자 (ciy8100@dailian.co.kr)

입력 2025.11.06 09:00  수정 2025.11.06 09:16

국내 첫 상업용 액체냉각 데이터센터 ‘가산 AI DC’ 공개

AI 발열 환경에 최적화된 ‘D2C’ 냉각 기술 적용…차세대 DC 기준 제시

전력·부지·규제 허들 속 ‘기술 중심’ 데이터센터 전략 관심

kt cloud 가산 AI 데이터센터 개소식에서 최지웅 대표가 환영사를 하고 있다.ⓒ kt cloud

젠슨 황 엔비디아 최고경영자(CEO)가 지난달 말 경주에서 열린 아시아태평양경제협력체(APEC) CEO 서밋에서 그래픽처리장치(GPU) 26만장 공급 계획을 발표하자 업계가 들썩였다.


AI 인프라가 빠르게 팽창하는 조짐을 보이면서, 이를 관리·운용하는 AI 데이터센터(AI DC)에 대한 관심도 커지고 있다. kt cloud는 국내 최초로 리퀴드 쿨링(Liquid Cooling, 액체 냉각)을 적용한 상업용 데이터센터 ‘가산 AI 데이터센터(가산 AI DC)’를 통해 AI 시대를 주도하겠다는 청사진을 내놨다.


국내 첫 상업용 액체냉각 데이터센터 ‘가산 AI DC’

지난 5일 찾아간 kt cloud '가산 AI DC'는 연면적 약 1만1046평, 지하 5층·지상 10층 규모로 조성된, 총 수전 용량 40MW(메가와트), IT 용량 26MW를 갖춘 초거대 AI 인프라 허브다.


AI 연산에 최적화된 고집적·초고집적 존 중심의 전용 공간 설계를 통해 고성능 AI 인프라 운영에 최적화된 환경을 구현했다.


특히 전력 및 통신 인입의 이중화 설계로 시스템 안정성을 강화했다. 이중화 설계는 전력과 통신 회선을 두 갈래로 구성해, 한쪽에 장애가 발생해도 다른 쪽이 자동으로 작동하도록 한 구조를 말한다.


가산 AI DC는 고성능 GPU 서버에서 발생하는 열을 효율적으로 제어하기 위해 액체를 활용한 ‘리퀴드 쿨링’ 기술을 국내 상업용 데이터센터 최초로 도입했다.


이 기술은 GPU 칩에 콜드플레이트를 부착하고 냉수를 직접 접촉시키는 D2C(Direct to Chip, 직접 칩 냉각) 방식을 기반으로 한다. 공랭식이 공기로 식히는 방식이라면, 리퀴드 쿨링은 냉수를 써서 열을 빠르게 빼낸다.


이를 위해 kt cloud는 B200 등 최신 엔비디아 GPU(그래픽처리장치) 기반 AI 서버의 고열 환경을 테스트하고, 제어하기 위한 리퀴드 쿨링 부하기를 자체 개발해 성능 검증을 완료했다.


리퀴드 쿨링 시스템의 랙(rack)당 처리 용량과 관련해 최 대표는 “글로벌 사업자 요청으로 최대 160kW(킬로와트)급이 들어와 있다”며 “기술팀이 이에 맞춰 설비를 세팅하고 있다”고 설명했다. 이는 엔비디아의 AI 가속기 ‘블랙웰(Blackwell)’급 GPU 시스템도 운영할 수 있다는 의미로 해석된다.




가산 AI 데이터센터 개소식을 기념해 테이프 커팅을 진행하고 있다.kt cloud 허영만 DC본부장(우측부터), KT 오승필 기술혁신부문 부사장, KT 안창용 Enterprise부문 부사장, kt cloud 최지웅 대표이사, 현대자동차 진은숙 부사장, 현대오토에버 양승도 상무, 퍼시픽자산운용 홍창민 대표이사, DL건설 여성찬 대표이사.ⓒkt cloud
AI 발열 환경에 최적화된 ‘D2C’ 냉각 기술 적용

이처럼 리퀴드 쿨링은 GPU 안정성과 내구성을 위해 반드시 필요한 기술이라고 최 대표는 강조했다.


그는 "GPU 발열량이 많아 내구성이 떨어질 수밖에 없다. 수명이 2~3년에 불과하다. 그러다 보니 리퀴드 쿨링은 필수적"이라며 "온도가 낮춰져야 오래 쓸 환경이 마련된다"고 말했다.


이어 "사업자들은 고객이 안정적이고 오래 사용할 수 있도록 환경을 만들어야 한다. 그러한 전략 방향을 고려할 수밖에 없다"고 덧붙였다.


이 기술 도입으로 AI 데이터센터 구축에 필요한 대규모 부지 매입 부담을 줄였다고도 최지웅 kt cloud 대표는 밝혔다.


그는 “공랭식 구조는 공조 장치 때문에 시설물 자체의 덩치가 크지만, 수냉 방식은 크기가 작아 대규모 부지가 필요하지 않다”고 말했다.


최 대표는 “향후 GPU 집적도가 높아지면 한 랙에 들어가는 용량이 커지고, 그만큼 큰 공간이 필요하지 않다”며 “도심 내 데이터센터는 접근성이 높아 전력만 확보된다면 효율적으로 운영할 수 있다”고 덧붙였다.


다만 긴 인허가 기간, 주민 반발 등은 데이터센터 선정·구축에 여전히 큰 허들로 작용하고 있다고 지적했다.


최 대표는 "규제·법규를 통과하는 데 1년 6개월 이상이 걸리고, 도심권은 주민 반발이 크다"면서 "전력이 들어가다 보니 전자파가 나올 것이라는 우려가 있는데 실제로는 전자레인지보다 나은 수준"이라고 설명했다.


이런 오해와 제도적 장벽이 해소돼야 센터 확충이 가능할 것이라고 최 대표는 전망했다.


kt cloud '가산 AI DC' 외관ⓒ kt cloud
리퀴드 쿨링 기반 ‘Colo.AI’로 기업 AI 전환 속도

가산 AI DC를 통해 kt cloud는 국내 최초의 ‘Colo.AI’ 서비스를 본격적으로 제공한다.


이 서비스는 고객 맞춤형 GPU 서버, 전용 네트워크, 운영 플랫폼, 유지보수까지 모두 포함된 통합형 턴키(Turnkey) AI 인프라 서비스로, 복잡한 인프라 구축 없이도 신속하고 안정적인 AI 환경 구현이 가능하다.


현재 국내 전문 AI 기업 A사, 중소 금융기업 B사 등이 Colo.AI를 활용해 대규모 AI 모델 학습 및 서비스 운영을 안정적으로 수행하고 있으며, 실제 운영 사례를 통해 서비스의 기술력과 신뢰성을 입증하고 있다. 이 외에도 다양한 산업 분야의 고객들이 Colo.AI 서비스 도입을 적극 검토 중이다.


Colo.AI 서비스의 강점에 대해 최 대표는 온디맨드 방식이어서 초기 투자 부담이 없고, 데이터센터 인프라와 통신망을 모두 갖춰 경쟁력이 높다고 밝혔다. 온디맨드 GPU는 사용자가 AI 모델 학습이나 추론용 GPU를 필요한 시간만큼 임시로 할당받아 사용하는 클라우드 서비스를 말한다.


그는 "B200으로 대형 클러스터를 구축했으며, 한 달 단위 구독 서비스를 제공한다. 고객은 구독을 종료하면 반납하면 된다”면서 “KT가 데이터센터 인프라부터 통신까지 갖추고 있어 필요한 인프라를 자유롭게 활용할 수 있는 것이 강점”이라고 말했다.


가산 AI DC에는 kt cloud의 AI 기반 최신 DC 기술이 집약적으로 적용돼 있다. kt cloud가 자체 개발해 특허 등록을 완료한 ‘패스 파인더(Path Finder)’ 솔루션은 이번 데이터센터에 최초로 도입되었으며, 이를 통해 전력 계통을 실시간으로 모니터링하고, 자동 차단 및 복구를 수행함으로써 전원 신뢰성을 획기적으로 강화했다.


또 AI 분석을 기반으로 장애를 사전에 예측하고, 발생 상황을 자동 분류해 즉각적이고 정밀한 대응이 가능한 ‘자동화 운영 플랫폼(DIMS)’을 학습 데이터 기반으로 고도화해 운용 품질을개선했다. 데이터센터 운용이 필요한 기업들에 해당 서비스를 제공하며 안정적이고 효율적인 IT 인프라 관리 환경을 지원한다.


12월 개소 예정인 ‘AI 이노베이션 센터(AI Innovation Center)’에서는 리퀴드 쿨링을 포함한 다양한 에너지 절감 기술을 실증하고, 상용화 수준으로 고도화해 나갈 계획이다. 최지웅 kt cloud 대표는 "CDU(냉각수를 분배·순환시키는 핵심 장치)와 PD-25(냉각수 혼합액) 같은 리퀴드 쿨링 설비를 직접 볼 수 있다"고 말했다.


최근 KT가 차기 CEO 선임 절차에 착수하면서 클라우드 사업의 연속성에 대한 우려가 제기된다. 이에 대해 최 대표는 "(가능성은) 없다"고 잘라 말한 뒤 "현재도 단계별 테스트와 실증 작업이 이뤄지고 있다"고 강조했다.


아마존웹서비스(AWS) 등 빅테크의 국내 AI 데이터센터 진출에 대해서는 "큰 위협으로 보지 않는다"고 답했다.


최 대표는 "kt cloud는 상용 코로케이션과 온디맨드 GPU 서비스를 중심으로 실사용 고객 확보에 집중하고 있다"고 말했다. 상용 코로케이션은 기업이 자체 센터 대신 데이터센터 사업자의 공간과 설비를 임대해 서버를 운영하는 서비스를 말한다.

0

0

기사 공유

댓글 쓰기

조인영 기자 (ciy8100@dailian.co.kr)
기사 모아 보기 >
관련기사

댓글

0 / 150
  • 최신순
  • 찬성순
  • 반대순
0 개의 댓글 전체보기