Kubernetes 32

[AI인프라] GPU 5만장 시대, AI 인프라 비즈니스 성공 조건

[ kt cloud Foundation플랫폼팀 서준호 님 ] 📋 요약 이 글에서는 AI 인프라 비즈니스의 핵심 경쟁력인 GPU 중심 인프라와 풀스택 최적화 전략을 다룹니다.운영 효율성과 비용 경쟁력을 높이는 실질적 방향을 정리합니다.#AI인프라 #GPU #풀스택최적화 #Neoclouds #AI데이터센터 1. Neoclouds 의 탄생Neoclouds의 목적은 단 하나, AI를 위한 최적의 환경을 제공하는 것입니다. 이들은 GPU 중심의 대규모 병렬 연산, 고대역폭 네트워킹, 저지연 스토리지, 고도화된 데이터센터 관리 기능을 갖추어 비용 효율적인 인프라 서비스를 제공합니다. 천편일률적인 옵션을 제시하는 Hyperscalers 와 달리, Neoclouds는 고객의 특수한 요구와 진화하는 ..

[기술 분석] kubernetes Ingress API의 중단. 그 뒤를 잇는 Gateway API 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Ingress API의 지원 중단 배경과 Gateway API의 개념 및 활용 방식을 다룹니다.클러스터 트래픽 관리의 표준 변화에 맞춰 운영 안정성과 확장성을 높이는 방향을 정리합니다.#Kubernetes #Ingress #GatewayAPI #NginxGatewayFabric #HTTPRoute 지난 11월, kubernetes는 Ingress NGINX의 기술지원 중단을 발표했고, 이에 대한 대안책으로 Gateway API로 교체해서 사용할 것을 권장했습니다. Ingress NGINX Retirement: What You Need to KnowTo prioritize the ..

[백업·DR] kt cloud 재해복구 설계: Multi-AZ와 Multi-Region

[ kt cloud 제안TF 심대섭 님 ] 📋 요약 이 글에서는 Multi-AZ와 Multi-Region의 차이와 재해복구 설계 시 고려해야 할 핵심 요소를 다룹니다.안정적인 서비스 운영과 장애 대응 수준을 결정하기 위한 현실적인 설계 방향을 정리합니다.#Multi-AZ #Multi-Region #재해복구 #DR #RTO #RPO Multi-AZ vs Multi-Region DR 설계 전략클라우드 아키텍처를 설계할 때 많은 조직이 가장 먼저 고민하는 주제가 있습니다. Multi-AZ과 Multi-Region 중 어떤 구조가 더 안전한가 하는 질문입니다.겉보기에는 여러 Region을 사용하는 구조가 더 안전해 보입니다. 그러나 실제 서비스 운영이나 DR 훈련 환경에서는 상황이 그렇게 단순..

[도입가이드] 인프라 관리의 표준, IaC의 본질과 도입 가치

[ kt cloud Azure전환팀 변세림 님 ] 📋 요약 이 글에서는 클라우드 인프라를 코드로 관리하는 IaC의 개념과 도입 가치를 다룹니다.수동 관리로 인한 설정 불일치와 복구 지연을 줄이고, 운영 안정성을 높이는 실무 방향을 정리합니다.#IaC #InfrastructureAsCode #Terraform #클라우드인프라 #DevOps 안녕하세요. 🙋클라우드를 처음 도입할 때만 해도 웹 콘솔에서 클릭 몇 번으로 서버를 뚝딱 만드는 게 마법처럼 느껴졌어요. 하지만 여러 migration 프로젝트를 진행하면서 하루에도 수십 개의 인프라를 찍어내야 하는 상황이 반복되자, 그 마법은 점점 감당하기 어려운 운영 부담으로 바뀌기 시작했어요."분명히 매뉴얼대로 했는데 왜 설정이 달라져 있지?""..

Tech Story/etc. 2026.05.14

[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선

[ kt cloud Platform엔지니어링팀 이지은 님 ] 📋 요약 이 글에서는 Kubernetes v1.35 Timbernetes의 주요 변화와 AI 워크로드, 리소스 관리, 보안·운영 측면의 개선을 다룹니다.클러스터 운영 안정성과 비용 효율을 높이기 위한 업그레이드 방향을 정리합니다.#Kubernetes #Timbernetes #GangScheduling #OCIImageVolume #클라우드네이티브 Timbernetes: The World Tree Release2025년 12월 17일, Kubernetes 커뮤니티가 한 해의 마지막 메이저 릴리즈인 v1.35를 공개했습니다. 코드명은 Timbernetes: The World Tree Release — 북유럽 신화 속 우주를 연결하..

[트러블슈팅] Kubernetes StatefulSet 스토리지 확장: Non-cascade 전략으로 무중단 Immutable 제약 극복

[ kt cloud Foundation플랫폼팀 이초환 님 ] 📋 요약 이 글에서는 Kubernetes StatefulSet 환경에서 volumeClaimTemplates의 Immutable 제약을 우회하여서비스 중단 없이 PVC 스토리지를 확장하는 Non-cascade 전략과 단계별 절차를 다룹니다.운영 중인 Pod의 가용성을 유지하면서 컨트롤러와 리소스의 생명주기를 분리하는 접근이실제 인프라 확장 작업에서 얼마나 안전하고 효과적인지를 정리합니다. #Kubernetes #StatefulSet #PVC #Non-cascade #OnlineVolumeExpansion1. StatefulSet 환경에서 스토리지 확장이 어려운 이유일반적인 Stateless 애플리케이션(Deployment)은 ..

[아키텍처] kt cloud PLATFORM 보안 거버넌스의 수립: Vault 도입과 효율적인 시크릿 전달 전략 (ESO & CSI)

[ kt cloud Foundation플랫폼팀 이지은 님 ] 📋 요약 이 글에서는 GitOps 환경에서 발생하는 시크릿 보안 문제를 해결하기 위해 HashiCorp Vault를 도입하고,ESO와 CSI Provider를 활용한 두 가지 시크릿 전달 전략을 다룹니다.보안 거버넌스를 플랫폼 수준에서 내재화함으로써 개발자의 부담을 줄이고대규모 MSA 환경에서의 운영 안정성과 규정 준수 수준을 높이는 방향을 정리합니다.#HashiCorpVault #ExternalSecretsOperator #CSIProvider #시크릿관리 #보안거버넌스1. GitOps의 딜레마: 모든 것을 코드로, 하지만 비밀은 빼고?우리는 지난 아티클에서 Helm과 ArgoCD를 통해 인프라의 상태를 코드로 정의하는 선언..

[비교분석] Calico vs Cilium : kubernetes에서 eBPF를 대하는 두 CNI 거인

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes 네트워킹의 핵심 구성요소인 CNI를 중심으로,Calico eBPF 모드와 Cilium의 기술적 차이를 다룹니다.두 CNI의 아키텍처 철학과 운영 특성을 비교함으로써,클러스터 환경에 적합한 네트워킹 솔루션 선택의 기준을 정리합니다.#CNI #eBPF #Calico #Cilium #Kubernetes 개요지난해 kt cloud는 마스터 노드(Control Plane) 관리를 자동화하여 Cloud Native 환경의 운영 부담을 획기적으로 줄여주는 관리형 쿠버네티스 서비스, Managed KS를 선보였습니다. Managed KS 클러스터의 네트워킹을 책임지는 핵심 엔진으로는 Calic..

[기술리포트] 클라우드 네이티브 2편 : 애플리케이션 이식성 강화 - 컨테이너·배포 전략

[ kt cloud Cloud컨설팅팀 심대섭 님 ] 📋 요약 이 글에서는 클라우드 네이티브 환경에서 애플리케이션 이식성을 강화하기 위한컨테이너 패키징, 설정 외부화, 배포 전략의 핵심 원칙과 실무 적용 방법을 다룹니다.이를 통해 장애 발생 시 수리가 아닌 재배포 중심의 복구 전략을 수립하고,무중단 배포와 운영 복원력을 확보하는 방향을 정리합니다. #클라우드네이티브 #컨테이너 #쿠버네티스 #애플리케이션이식성 #배포전략현재 대부분의 신규 서비스는 컨테이너와 쿠버네티스를 전제로 설계합니다. 그런데 장애 분석 회의에 들어가 보면 원인은 여전히 익숙한 패턴에서 나옵니다. 특정 노드에만 설치된 라이브러리, 환경마다 미묘하게 다른 설정, 롤백이 안 되는 배포 파이프라인 같은 것들입니다. 인프라는 멀..

[기술리포트] 클라우드 네이티브 1편 : 가용성 설계 재조명 - 배포·격리·상태·검증 4대 원칙

[ kt cloud Cloud컨설팅팀 심대섭 님 ] 📋 요약 이 글에서는 클라우드 네이티브 환경에서 서비스 가용성을 확보하기 위한네 가지 핵심 설계 원칙(애플리케이션 이식성 및 배포 전략,장애 도메인과 격리 설계, 상태 관리와 데이터 일관성, 카오스 엔지니어링과 복원력 검증)을 다룹니다. 장애의 출발점이 인프라가 아닌 변경과 운영 방식으로 이동한 현실에서,실제 아키텍처 의사결정에 적용 가능한 설계 프레임워크와 검증 방법을 정리합니다.#클라우드네이티브 #가용성설계 #장애격리 #카오스엔지니어링 #멀티리전현재, 조직의 규모와 무관하게 대부분의 조직은 어떤 형태로든 클라우드를 활용하고 있습니다. 신규 서비스는 컨테이너와 Kubernetes 기반으로 구축되고, 기존 레거시 시스템도 단계적으로 클..