Kubernetes 37

[사례연구] 사내 개인용 개발환경 이미지 실험기 1부: git push로 업데이트되는 OpenStack 샌드박스 만들기

[ kt cloud Platform엔지니어링팀 이초환 님 ] 📋 요약 이 글에서는 GitOps 기반 개인용 OpenStack 샌드박스 이미지를 구축하고 업데이트하는 실험 과정을 다룹니다.개발환경 표준화와 운영 부담 완화에 주는 실무적 의미를 정리합니다.#OpenStack #GitOps #ArgoCD #FluxCD #Kubernetes 1. 배경 — 이 프로젝트를 시작한 맥락저희 조직은 OpenStack 기반 서비스를 개발하고 있고, 여러 개발자·팀이 함께 쓰는 통합 개발환경이 있습니다. 통합환경은 각 서비스가 서로 상호작용하는 공유 공간이다 보니, 서비스를 단독으로 변경·테스트하려면 별도의 독립 환경이 필요합니다. 개인 단위 실험까지 공유 환경에서 하기엔 부담이 컸고, 그래서 개인별·서..

[기술분석] Kubernetes Gateway API에서 트래픽을 세밀하게 제어하는 Policy 객체 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Gateway API의 Policy 객체를 활용해 트래픽 동작을 제어하는 방식과 적용 범위를 다룹니다.운영 환경에서 설정 혼선을 줄이고 안정적인 트래픽 관리를 위한 기준을 정리합니다.#Kubernetes #GatewayAPI #Policy #ClientSettingsPolicy #BackendTLSPolicy 1. 개요이전 편에서 Gateway API 사용해서 Gateway와 HTTPRoute로 기본 라우팅을 구성했다면, 이번 편에서는 Policy 객체로 트래픽을 세밀하게 제어하는 방법을 다룹니다. 타임아웃, 세션 유지, 백엔드 TLS 등 기존 Ingress에서 Annotatio..

[전환가이드] ArgoCD·FluxCD GitOps 배포를 HelmRelease로 전환하는 방법

[ kt cloud Foundation플랫폼팀 이지은 님 ] 📋 요약 이 글에서는 ArgoCD와 FluxCD 기반 GitOps 배포를 HelmRelease 방식으로 전환하는 과정과 운영 시 고려사항을 다룹니다.인프라 배포를 선언적으로 관리해 변경 추적과 운영 안정성을 높이는 방향을 정리합니다.#ArgoCD #FluxCD #GitOps #HelmRelease #Kubernetes 안녕하세요. 지난 글에서 OpenStack Helm 배포를 FluxCD HelmRelease 방식으로 전환한 경험을 공유드렸는데요.이번에는 그 연장선으로 ArgoCD 자체를 동일한 방식으로 전환한 이야기입니다. "배포 도구인 ArgoCD를 ArgoCD+FluxCD로 관리한다"는 다소 순환적으로 들릴 수 있지만, ..

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

[ kt cloud Foundation플랫폼팀 서준호 님 ] 📋 요약 이 글에서는 Kubernetes 기반 Fault-Tolerant GPU 클러스터의 안정적 운영과 유지 관리 방안을 다룹니다.대규모 AI 인프라에서 장애 대응과 성능 저하 예방이 운영 신뢰성에 미치는 의미를 정리합니다.#Kubernetes #GPU클러스터 #FaultTolerance #Slurm #InfiniBand 생성형 AI와 대규모 언어 모델(LLM) 시대에 고성능 연산에 대한 수요는 일시적인 급증을 넘어, 이제는 거대하고 지속적인 워크로드로 변화했습니다. 수십억 개의 파라미터를 가진 모델을 학습시키는 것은 단순히 계산 능력을 겨루는 일이 아닌, 인프라를 안정적으로 운영하는 레이스와 같습니다. 수천 개의 GPU를 ..

[도입전략] Git 시크릿 관리와 Vault 도입으로 보안 강화하기

[ kt cloud Foundation플랫폼팀 이초환 님 ] 📋 요약 이 글에서는 Git 시크릿 관리 개선과 Kubernetes Secret 오브젝트 제거를 위한 Vault 도입 전략을 다룹니다.시크릿 노출 위험을 줄이고 운영 환경의 보안 기준을 명확히 하는 방향을 정리합니다.#Vault #GitSecret #Kubernetes #CSIProvider #시크릿관리 왜 Sealed Secrets도 SOPS도 아닌 Vault였나 — 도입 배경과 전략요건은 두 가지였다회사에서 시크릿 관리 개선 요청을 받았다. 요건을 정리하니 두 가지로 요약됐다.Git 레포에 평문으로 관리되는 시크릿을 제거할 것Kubernetes 클러스터 위에 Secret 오브젝트로 민감정보가 떠 있는 것을 없앨 것두 번째 ..

[AI인프라] GPU 5만장 시대, AI 인프라 비즈니스 성공 조건

[ kt cloud Foundation플랫폼팀 서준호 님 ] 📋 요약 이 글에서는 AI 인프라 비즈니스의 핵심 경쟁력인 GPU 중심 인프라와 풀스택 최적화 전략을 다룹니다.운영 효율성과 비용 경쟁력을 높이는 실질적 방향을 정리합니다.#AI인프라 #GPU #풀스택최적화 #Neoclouds #AI데이터센터 1. Neoclouds 의 탄생Neoclouds의 목적은 단 하나, AI를 위한 최적의 환경을 제공하는 것입니다. 이들은 GPU 중심의 대규모 병렬 연산, 고대역폭 네트워킹, 저지연 스토리지, 고도화된 데이터센터 관리 기능을 갖추어 비용 효율적인 인프라 서비스를 제공합니다. 천편일률적인 옵션을 제시하는 Hyperscalers 와 달리, Neoclouds는 고객의 특수한 요구와 진화하는 ..

[기술 분석] kubernetes Ingress API의 중단. 그 뒤를 잇는 Gateway API 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Ingress API의 지원 중단 배경과 Gateway API의 개념 및 활용 방식을 다룹니다.클러스터 트래픽 관리의 표준 변화에 맞춰 운영 안정성과 확장성을 높이는 방향을 정리합니다.#Kubernetes #Ingress #GatewayAPI #NginxGatewayFabric #HTTPRoute 지난 11월, kubernetes는 Ingress NGINX의 기술지원 중단을 발표했고, 이에 대한 대안책으로 Gateway API로 교체해서 사용할 것을 권장했습니다. Ingress NGINX Retirement: What You Need to KnowTo prioritize the ..

[백업·DR] kt cloud 재해복구 설계: Multi-AZ와 Multi-Region

[ kt cloud 제안TF 심대섭 님 ] 📋 요약 이 글에서는 Multi-AZ와 Multi-Region의 차이와 재해복구 설계 시 고려해야 할 핵심 요소를 다룹니다.안정적인 서비스 운영과 장애 대응 수준을 결정하기 위한 현실적인 설계 방향을 정리합니다.#Multi-AZ #Multi-Region #재해복구 #DR #RTO #RPO Multi-AZ vs Multi-Region DR 설계 전략클라우드 아키텍처를 설계할 때 많은 조직이 가장 먼저 고민하는 주제가 있습니다. Multi-AZ과 Multi-Region 중 어떤 구조가 더 안전한가 하는 질문입니다.겉보기에는 여러 Region을 사용하는 구조가 더 안전해 보입니다. 그러나 실제 서비스 운영이나 DR 훈련 환경에서는 상황이 그렇게 단순..

[도입가이드] 인프라 관리의 표준, IaC의 본질과 도입 가치

[ kt cloud Azure전환팀 변세림 님 ] 📋 요약 이 글에서는 클라우드 인프라를 코드로 관리하는 IaC의 개념과 도입 가치를 다룹니다.수동 관리로 인한 설정 불일치와 복구 지연을 줄이고, 운영 안정성을 높이는 실무 방향을 정리합니다.#IaC #InfrastructureAsCode #Terraform #클라우드인프라 #DevOps 안녕하세요. 🙋클라우드를 처음 도입할 때만 해도 웹 콘솔에서 클릭 몇 번으로 서버를 뚝딱 만드는 게 마법처럼 느껴졌어요. 하지만 여러 migration 프로젝트를 진행하면서 하루에도 수십 개의 인프라를 찍어내야 하는 상황이 반복되자, 그 마법은 점점 감당하기 어려운 운영 부담으로 바뀌기 시작했어요."분명히 매뉴얼대로 했는데 왜 설정이 달라져 있지?""..

Tech Story/etc. 2026.05.14

[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선

[ kt cloud Platform엔지니어링팀 이지은 님 ] 📋 요약 이 글에서는 Kubernetes v1.35 Timbernetes의 주요 변화와 AI 워크로드, 리소스 관리, 보안·운영 측면의 개선을 다룹니다.클러스터 운영 안정성과 비용 효율을 높이기 위한 업그레이드 방향을 정리합니다.#Kubernetes #Timbernetes #GangScheduling #OCIImageVolume #클라우드네이티브 Timbernetes: The World Tree Release2025년 12월 17일, Kubernetes 커뮤니티가 한 해의 마지막 메이저 릴리즈인 v1.35를 공개했습니다. 코드명은 Timbernetes: The World Tree Release — 북유럽 신화 속 우주를 연결하..