KT Cloud 66

GPU 1,000장 모니터링 하기: NVIDIA DCGM 활용 전략

[kt cloud AI플랫폼팀 최지우 님]  GPU 1,000장 모니터링하기: NVIDIA DCGM 활용 전략 AI 플랫폼을 운영하며 수천 장의 GPU를 다루는 일은 결코 단순하지 않습니다. 서버 수가 늘어날수록 관리와 모니터링의 복잡도도 기하급수적으로 증가하고, 그만큼 예상치 못한 문제가 발생할 가능성도 커집니다. 특히 AI 플랫폼을 통해 수많은 고객에게 안정적인 서비스를 제공하려면 GPU 서버의 상태와 성능을 지속적으로 모니터링하는 것이 필수적입니다. 그러나 서버 수가 수백 대에 이르면, 각 GPU의 상태를 일일이 확인하는 것은 사실상 불가능에 가깝습니다. kt cloud에서는 AI Train, AI SERV 등 GPU 서버를 제공하는 서비스들에서 수천 장의 GPU를 제공하고 있습니다. 저희는 AI ..

Tech story/AI Cloud 2024.11.07

안정성과 확장성을 동시에 : kt cloud의 새로운 ‘Object Storage’ 출시

[kt cloud 상품전략팀 최영화 님] 안정성과 확장성을 동시에 : kt cloud의 새로운 ‘Object Storage’ 출시타이틀  이번 가을, kt cloud의 새로운 ‘Object Storage’를 출시합니다.기존 오브젝트 스토리지 대비 다양한 콘솔 기능 및 특장점을 갖춘 서비스로서, 공공 클라우드에 우선 제공할 예정이며, 이후 민간 클라우드도 오픈 됩니다.“그럼 기존 Object Storage도 여러 버전이 있는데, 여기에 새로운 버전이 추가되는 것인가?”라는 질문이 있을 것 같습니다.그래서 기존 Object Storage와의 차이점에 대해 간단히 살펴보고자 합니다.  현재 쓰고 있는 Object Storage는 사라지나요?   아닙니다!기존의 ‘Storage 1.0 / 2.0 / 3.0' 서..

Tech story/Cloud 2024.10.24

kt cloud, 엔비디아 GPU 기반 AI 학습용 인프라 서비스 ‘AI Train’ 출시

▶ 대규모 GPU 노드 클러스터링, 동적할당 제어 등 성능, 비용 강점 살린 학습 전용 AI 인프라▶ H100 등 엔비디아 기반 서비스 제공… AI 연구의 호환성과 범용성 갖춰▶ “파트너들과 협업 이어가며 고객 맞춤형 AI 인프라 환경 구현할 것”kt cloud(http://www.ktcloud.com, 대표이사 최지웅)가 엔비디아 GPU(Graphic Processing Unit, 그래픽처리장치)를 적용한 AI 학습 전용 인프라 서비스, ‘AI Train’을 출시했다고 30일 밝혔다. 이번 출시된 AI Train은 초거대 AI 분야에서 단기간 집중적으로 대용량, 고사양의 GPU 공급이 필요한 학습 영역에 특화된 서비스다. AI Train은 kt cloud가 지난 ‘22년 선보인 HAC(Hyperscal..

News/Press release 2024.06.24

K-클라우드의 심장, ‘고성능, 저전력’ 국산 AI반도체 기반 AI Cloud Farm 구축 완료 ( w. NIPA 정보통신산업진흥원)

세계적인 반도체 전쟁에서 승리하기 위해 K-클라우드 프로젝트로 국산 AI반도체가 조속히 레퍼런스를 확보해 국내는 물론 글로벌 시장에도 진출할 수 있도록 적극 지원하겠습니다. -'K-클라우드 프로젝트 1단계 착수보고회' 내용 中- AI는 수많은 데이터를 학습하고 추론한 결과를 도출합니다. 학습 데이터를 단시간에 받아들이고 처리하기 위해서는 ‘AI 반도체’가 필수인 시대가 도래하였는데요.😁😀 AI 반도체는 AI 서비스 구현에 필요한 대규모 연산을 초고속, 초전력으로 실행하는 효율성 측면에서 특화된 비메모리 반도체로 각광을 받고 있습니다. 🎊🎉 지난 8월 23일 시장조사업체 가트너가 발표한 AI반도체 시장의 성장률이 AI 산업의 장밋빛 미래를 실감케 합니다. 📃✏📌 보고서에 따르면, 올해 전 세계 AI 반도체..

Tech story/AI Cloud 2023.11.30

kt cloud, 용산 IDC ‘공공 전용 클라우드존’ 구축… ‘DR’ 강화 나선다

▶용산 IDC-천안 CDC 간 공공 클라우드존 이원화로 클라우드 안정성↑ ▶CSAP ‘상’ 등급 포함한 국가 및 공공기관 전체 시스템에 대한 클라우드 전환 지원 목표 ▶ “한층 강화된 보안을 통해 공공 고객들에게 안전하고, 끊김 없는 서비스 환경 제공” kt cloud(http://www.ktcloud.com, 대표이사 윤동식)는 공공 클라우드 DR 강화를 위해 용산 IDC 내 ‘공공 전용 클라우드존’을 구축했다고 30일 밝혔다. 용산 IDC 공공 클라우드존은 완벽한 이원화 환경 구축을 통해 위기상황 발생 시 서비스 중단 없이 안정적으로 공공 클라우드 서비스를 제공하고자 마련됐다. kt cloud는 기존 천안 CDC(클라우드 데이터센터) 공공 클라우드존과 용산 IDC 공공 전용 클라우드존을 함께 운영하며..

News/Press release 2023.11.02