KT Cloud 75

[기술리포트] AI 시대 데이터센터의 게임체인저, 액침냉각 기술의 모든 것 - kt cloud의 PoC 결과까지

[ kt cloud DC동부운용센터 박지현 님 ] 데이터센터에 새로운 냉각 방식이 필요한 이유2022년 11월 출시된 미국의 인공지능 연구소 오픈AI(OpenAI)의 챗GPT(ChatGPT)로부터 촉발된 인공지능(AI) 혁명은 전 산업 분야로 확산되며 디지털 전환을 가속화하고 있습니다. AI의 학습과 추론을 위해서는 AI 가속기(AI accelerator)와 같은 스펙이 높은 하드웨어가 필요하게 되는데 하드웨어의 성능 향상에 따라 전력 요구 사항 또한 증가하고 있습니다. 장치에서 사용되는 전기 에너지는 열에너지로 변환되기 때문에 AI 인프라가 설치된 데이터센터에서는 열이 많이 발생하게 됩니다. AI 서비스 환경에 특화된 데이터센터(Data Center)에서는 기존의 냉각 방식인 공기 냉각 방식(Air C..

GPU 1,000장 모니터링 하기: NVIDIA DCGM 활용 전략

[kt cloud AI플랫폼팀 최지우 님]  GPU 1,000장 모니터링하기: NVIDIA DCGM 활용 전략 AI 플랫폼을 운영하며 수천 장의 GPU를 다루는 일은 결코 단순하지 않습니다. 서버 수가 늘어날수록 관리와 모니터링의 복잡도도 기하급수적으로 증가하고, 그만큼 예상치 못한 문제가 발생할 가능성도 커집니다. 특히 AI 플랫폼을 통해 수많은 고객에게 안정적인 서비스를 제공하려면 GPU 서버의 상태와 성능을 지속적으로 모니터링하는 것이 필수적입니다. 그러나 서버 수가 수백 대에 이르면, 각 GPU의 상태를 일일이 확인하는 것은 사실상 불가능에 가깝습니다. kt cloud에서는 AI Train, AI SERV 등 GPU 서버를 제공하는 서비스들에서 수천 장의 GPU를 제공하고 있습니다. 저희는 AI ..

[kt cloud] 2024년 Front-end 개발 트렌드를 돌아보며: 클라우드와의 조화

[kt cloud 마케팅커뮤니케이션팀 김지웅 님 ]    Introduction: 프론트엔드 개발의 변곡점클라우드와 프론트엔드 개발의 변화2024년은 프론트엔드 개발에 있어 중요한 변곡점이 된 해였습니다. 기존의 전통적인 프론트엔드 개발 방식에서 벗어나 클라우드 기술과의 연결이 더욱 깊어지면서, 개발자들에게 새로운 기회를 제공하고 있습니다. 클라우드와 프론트엔드 개발의 융합은 단순히 서버리스 아키텍처와 API 중심 설계에 그치지 않고 성능, 확장성, 그리고 보안 측면에서 폭넓은 영향을 미쳤습니다. 클라우드 네이티브 기술의 도입으로 자동 확장성과 자원 효율성이 프론트엔드 개발에 적용되면서 프론트엔드 팀은 백엔드 의존도를 줄이면서도 더 빠르고 유연한 개발을 진행할 수 있게 되었습니다. 특히 클라우드 네이티..

안정성과 확장성을 동시에 : kt cloud의 새로운 ‘Object Storage’ 출시

[kt cloud 상품전략팀 최영화 님] 안정성과 확장성을 동시에 : kt cloud의 새로운 ‘Object Storage’ 출시타이틀  이번 가을, kt cloud의 새로운 ‘Object Storage’를 출시합니다.기존 오브젝트 스토리지 대비 다양한 콘솔 기능 및 특장점을 갖춘 서비스로서, 공공 클라우드에 우선 제공할 예정이며, 이후 민간 클라우드도 오픈 됩니다.“그럼 기존 Object Storage도 여러 버전이 있는데, 여기에 새로운 버전이 추가되는 것인가?”라는 질문이 있을 것 같습니다.그래서 기존 Object Storage와의 차이점에 대해 간단히 살펴보고자 합니다.  현재 쓰고 있는 Object Storage는 사라지나요?   아닙니다!기존의 ‘Storage 1.0 / 2.0 / 3.0' 서..

kt cloud, 엔비디아 GPU 기반 AI 학습용 인프라 서비스 ‘AI Train’ 출시

▶ 대규모 GPU 노드 클러스터링, 동적할당 제어 등 성능, 비용 강점 살린 학습 전용 AI 인프라▶ H100 등 엔비디아 기반 서비스 제공… AI 연구의 호환성과 범용성 갖춰▶ “파트너들과 협업 이어가며 고객 맞춤형 AI 인프라 환경 구현할 것”kt cloud(http://www.ktcloud.com, 대표이사 최지웅)가 엔비디아 GPU(Graphic Processing Unit, 그래픽처리장치)를 적용한 AI 학습 전용 인프라 서비스, ‘AI Train’을 출시했다고 30일 밝혔다. 이번 출시된 AI Train은 초거대 AI 분야에서 단기간 집중적으로 대용량, 고사양의 GPU 공급이 필요한 학습 영역에 특화된 서비스다. AI Train은 kt cloud가 지난 ‘22년 선보인 HAC(Hyperscal..