DevOps 문화와 컨테이너 기술에 관한 전문 지식을 공유합니다. kt cloud의 인프라 환경에서 최적화된 CI/CD, 쿠버네티스, 도커 활용 방법을 소개합니다.

Tech Story/DevOps & Container 56

[사례연구] 사내 개인용 개발환경 이미지 실험기 1부: git push로 업데이트되는 OpenStack 샌드박스 만들기

[ kt cloud Platform엔지니어링팀 이초환 님 ] 📋 요약 이 글에서는 GitOps 기반 개인용 OpenStack 샌드박스 이미지를 구축하고 업데이트하는 실험 과정을 다룹니다.개발환경 표준화와 운영 부담 완화에 주는 실무적 의미를 정리합니다.#OpenStack #GitOps #ArgoCD #FluxCD #Kubernetes 1. 배경 — 이 프로젝트를 시작한 맥락저희 조직은 OpenStack 기반 서비스를 개발하고 있고, 여러 개발자·팀이 함께 쓰는 통합 개발환경이 있습니다. 통합환경은 각 서비스가 서로 상호작용하는 공유 공간이다 보니, 서비스를 단독으로 변경·테스트하려면 별도의 독립 환경이 필요합니다. 개인 단위 실험까지 공유 환경에서 하기엔 부담이 컸고, 그래서 개인별·서..

[기술분석] Kubernetes Gateway API에서 트래픽을 세밀하게 제어하는 Policy 객체 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Gateway API의 Policy 객체를 활용해 트래픽 동작을 제어하는 방식과 적용 범위를 다룹니다.운영 환경에서 설정 혼선을 줄이고 안정적인 트래픽 관리를 위한 기준을 정리합니다.#Kubernetes #GatewayAPI #Policy #ClientSettingsPolicy #BackendTLSPolicy 1. 개요이전 편에서 Gateway API 사용해서 Gateway와 HTTPRoute로 기본 라우팅을 구성했다면, 이번 편에서는 Policy 객체로 트래픽을 세밀하게 제어하는 방법을 다룹니다. 타임아웃, 세션 유지, 백엔드 TLS 등 기존 Ingress에서 Annotatio..

[전환가이드] ArgoCD·FluxCD GitOps 배포를 HelmRelease로 전환하는 방법

[ kt cloud Foundation플랫폼팀 이지은 님 ] 📋 요약 이 글에서는 ArgoCD와 FluxCD 기반 GitOps 배포를 HelmRelease 방식으로 전환하는 과정과 운영 시 고려사항을 다룹니다.인프라 배포를 선언적으로 관리해 변경 추적과 운영 안정성을 높이는 방향을 정리합니다.#ArgoCD #FluxCD #GitOps #HelmRelease #Kubernetes 안녕하세요. 지난 글에서 OpenStack Helm 배포를 FluxCD HelmRelease 방식으로 전환한 경험을 공유드렸는데요.이번에는 그 연장선으로 ArgoCD 자체를 동일한 방식으로 전환한 이야기입니다. "배포 도구인 ArgoCD를 ArgoCD+FluxCD로 관리한다"는 다소 순환적으로 들릴 수 있지만, ..

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

[ kt cloud Foundation플랫폼팀 서준호 님 ] 📋 요약 이 글에서는 Kubernetes 기반 Fault-Tolerant GPU 클러스터의 안정적 운영과 유지 관리 방안을 다룹니다.대규모 AI 인프라에서 장애 대응과 성능 저하 예방이 운영 신뢰성에 미치는 의미를 정리합니다.#Kubernetes #GPU클러스터 #FaultTolerance #Slurm #InfiniBand 생성형 AI와 대규모 언어 모델(LLM) 시대에 고성능 연산에 대한 수요는 일시적인 급증을 넘어, 이제는 거대하고 지속적인 워크로드로 변화했습니다. 수십억 개의 파라미터를 가진 모델을 학습시키는 것은 단순히 계산 능력을 겨루는 일이 아닌, 인프라를 안정적으로 운영하는 레이스와 같습니다. 수천 개의 GPU를 ..

[기술 분석] kubernetes Ingress API의 중단. 그 뒤를 잇는 Gateway API 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Ingress API의 지원 중단 배경과 Gateway API의 개념 및 활용 방식을 다룹니다.클러스터 트래픽 관리의 표준 변화에 맞춰 운영 안정성과 확장성을 높이는 방향을 정리합니다.#Kubernetes #Ingress #GatewayAPI #NginxGatewayFabric #HTTPRoute 지난 11월, kubernetes는 Ingress NGINX의 기술지원 중단을 발표했고, 이에 대한 대안책으로 Gateway API로 교체해서 사용할 것을 권장했습니다. Ingress NGINX Retirement: What You Need to KnowTo prioritize the ..

[분석] Kubernetes v1.35 Timbernetes: 6년 만의 GA, AI 스케줄링, 기술 부채 개선

[ kt cloud Platform엔지니어링팀 이지은 님 ] 📋 요약 이 글에서는 Kubernetes v1.35 Timbernetes의 주요 변화와 AI 워크로드, 리소스 관리, 보안·운영 측면의 개선을 다룹니다.클러스터 운영 안정성과 비용 효율을 높이기 위한 업그레이드 방향을 정리합니다.#Kubernetes #Timbernetes #GangScheduling #OCIImageVolume #클라우드네이티브 Timbernetes: The World Tree Release2025년 12월 17일, Kubernetes 커뮤니티가 한 해의 마지막 메이저 릴리즈인 v1.35를 공개했습니다. 코드명은 Timbernetes: The World Tree Release — 북유럽 신화 속 우주를 연결하..

[트러블슈팅] Kubernetes StatefulSet 스토리지 확장: Non-cascade 전략으로 무중단 Immutable 제약 극복

[ kt cloud Foundation플랫폼팀 이초환 님 ] 📋 요약 이 글에서는 Kubernetes StatefulSet 환경에서 volumeClaimTemplates의 Immutable 제약을 우회하여서비스 중단 없이 PVC 스토리지를 확장하는 Non-cascade 전략과 단계별 절차를 다룹니다.운영 중인 Pod의 가용성을 유지하면서 컨트롤러와 리소스의 생명주기를 분리하는 접근이실제 인프라 확장 작업에서 얼마나 안전하고 효과적인지를 정리합니다. #Kubernetes #StatefulSet #PVC #Non-cascade #OnlineVolumeExpansion1. StatefulSet 환경에서 스토리지 확장이 어려운 이유일반적인 Stateless 애플리케이션(Deployment)은 ..

[아키텍처] kt cloud PLATFORM 보안 거버넌스의 수립: Vault 도입과 효율적인 시크릿 전달 전략 (ESO & CSI)

[ kt cloud Foundation플랫폼팀 이지은 님 ] 📋 요약 이 글에서는 GitOps 환경에서 발생하는 시크릿 보안 문제를 해결하기 위해 HashiCorp Vault를 도입하고,ESO와 CSI Provider를 활용한 두 가지 시크릿 전달 전략을 다룹니다.보안 거버넌스를 플랫폼 수준에서 내재화함으로써 개발자의 부담을 줄이고대규모 MSA 환경에서의 운영 안정성과 규정 준수 수준을 높이는 방향을 정리합니다.#HashiCorpVault #ExternalSecretsOperator #CSIProvider #시크릿관리 #보안거버넌스1. GitOps의 딜레마: 모든 것을 코드로, 하지만 비밀은 빼고?우리는 지난 아티클에서 Helm과 ArgoCD를 통해 인프라의 상태를 코드로 정의하는 선언..

[비교분석] Calico vs Cilium : kubernetes에서 eBPF를 대하는 두 CNI 거인

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes 네트워킹의 핵심 구성요소인 CNI를 중심으로,Calico eBPF 모드와 Cilium의 기술적 차이를 다룹니다.두 CNI의 아키텍처 철학과 운영 특성을 비교함으로써,클러스터 환경에 적합한 네트워킹 솔루션 선택의 기준을 정리합니다.#CNI #eBPF #Calico #Cilium #Kubernetes 개요지난해 kt cloud는 마스터 노드(Control Plane) 관리를 자동화하여 Cloud Native 환경의 운영 부담을 획기적으로 줄여주는 관리형 쿠버네티스 서비스, Managed KS를 선보였습니다. Managed KS 클러스터의 네트워킹을 책임지는 핵심 엔진으로는 Calic..

[튜토리얼] kt cloud가 자원을 최적화하는 방법: 컨테이너 리소스 동적할당 구현기

[ kt cloud AI플랫폼팀 최지우 님 ] 📋 요약 이 글에서는 Docker 환경에서 실행 중인 컨테이너의 CPU, 메모리, 포트 등 리소스를재시작 없이 동적으로 조정하는 구현 방법과 cgroup 기반 메커니즘을 다룹니다.이를 통해 클라우드 사업자는 자원 활용률을 극대화하고, 사용자는 서비스 중단 없이비용 최적화와 가용성을 확보할 수 있는 실질적 운영 전략을 정리합니다.#Docker #컨테이너리소스관리 #cgroups #동적할당 #클라우드최적화클라우드 환경에서 애플리케이션을 실행할 때 가장 흔히 사용하는 방식은 가상머신(VM)입니다. 하지만 VM 기반에서는 GPU와 같은 고가의 자원을 한 번 할당하면 실제 사용 여부와 상관없이 지속적으로 과금되는 구조적 한계가 있습니다. 이로 인해 ..