분류 전체보기 389

케클s피드 6월호|AI 시대, 인프라 운영 역량이 더 중요해진 이유

AI 비즈니스의 진짜 승부는 도입 이후부터 시작됩니다. 이제 기업 경쟁력은 AI 모델을 안정적으로 실행하고, 실제 서비스로 지속 운영할 수 있는 인프라 기반에서 결정되고 있습니다.이번 호는 2026년 상반기 Data Center·AI·Cloud 시장의 주요 흐름을 짚어보는 트렌드 리포트로 시작합니다. 또한 개발자의 반복 업무를 줄이고 클라우드 네이티브 서비스 개발 속도를 높여가는 플랫폼 엔지니어링팀의 인터뷰도 확인하실 수 있습니다. 이와 함께 중단 없는 클라우드 아키텍처 구현 전략을 다루는 웨비나와 kt cloud의 공공 전용 NPU Server 출시 소식까지 살펴봅니다. 2026년 상반기, AI 시장의 화두는 빠른 도입보다 안정적인 운영으로 이동하고 있습니다. 기업들은 AI를 실제 업무와 고객 서비스에..

[케클러 인터뷰 시리즈] #3 개발자가 본질에 집중하도록: kt cloud 플랫폼 엔지니어링 이야기

[ kt cloud 마케팅커뮤니케이션팀] 📋 요약 ‘기술이 장르가 되는 곳, kt cloud의 케클러 인터뷰 시리즈’는 케클러들의 목소리를 통해 고객의 다음 문제를 먼저 고민하는 kt cloud의 기술적 지향점과 해법을 전합니다.세 번째 호에서는 개발자가 본질에 집중할 수 있도록, 인프라와 운영의 복잡성을 줄여가는 김정남 팀장의 Self-Service 기반 플랫폼 엔지니어링 이야기를 소개합니다.#ktcloud #플랫폼엔지니어링 #DevOps #개발자경험 #인프라자동화 안녕하세요. kt cloud 마케팅커뮤니케이션팀입니다. 빠르게 변화하는 클라우드 환경에서 중요한 것은 새로운 서비스를 얼마나 빠르게 개발하고, 안정적으로 배포할 수 있는가입니다. 이를 위해서는 개발자 개인의 역량뿐 아니라,..

[사례연구] 사내 개인용 개발환경 이미지 실험기 1부: git push로 업데이트되는 OpenStack 샌드박스 만들기

[ kt cloud Platform엔지니어링팀 이초환 님 ] 📋 요약 이 글에서는 GitOps 기반 개인용 OpenStack 샌드박스 이미지를 구축하고 업데이트하는 실험 과정을 다룹니다.개발환경 표준화와 운영 부담 완화에 주는 실무적 의미를 정리합니다.#OpenStack #GitOps #ArgoCD #FluxCD #Kubernetes 1. 배경 — 이 프로젝트를 시작한 맥락저희 조직은 OpenStack 기반 서비스를 개발하고 있고, 여러 개발자·팀이 함께 쓰는 통합 개발환경이 있습니다. 통합환경은 각 서비스가 서로 상호작용하는 공유 공간이다 보니, 서비스를 단독으로 변경·테스트하려면 별도의 독립 환경이 필요합니다. 개인 단위 실험까지 공유 환경에서 하기엔 부담이 컸고, 그래서 개인별·서..

[트렌드 리포트] 2026 상반기 트렌드 결산: AI 활용부터 인프라 전환까지

[ kt cloud 마케팅커뮤니케이션팀 ] 📋 요약 Data Center, AI ,Cloud 중심으로 2026년 상반기 업계 주요 트렌드를 살펴보겠습니다. 2026년 상반기, 업계는 AI를 중심으로 빠르게 재편되었습니다. 이런 변화는 AI 기술에만 머물러 있지 않습니다. AI가 실제 업무에 적용되기 시작하면서, 이를 운영하기 위한 클라우드와 뒷받침하는 데이터센터까지 함께 변화하고 있습니다. 이번 콘텐츠에서는 2026년 상반기 주요 흐름을 Data Center, AI, Cloud 세 분야에서 살펴봅니다. AI 워크로드를 안정적으로 수용하기 위한 데이터센터 인프라 전환, 답변하는 AI에서 일하는 AI로의 변화, 데이터와 인프라 통제권을 둘러싼 클라우드 전략까지 핵심 키워드를 중심으로 정리했..

Tech Story/etc. 2026.06.22

[kt cloud 웨비나] 중단 없는 운영을 위한 클라우드

📋요약이번 kt cloud 웨비나에서는 공공·엔터프라이즈 환경의 실제 사례를 기반으로,고가용성(HA) 및 DR 구성 전략, 그리고 Multi-AZ 기반의 안정적인 플랫폼 운영 체계를 공유합니다. 안녕하세요. kt cloud 마케팅커뮤니케이션팀입니다. AI·클라우드 환경에서는 장애 대응보다 ‘중단되지 않는 구조’를 설계하는 역량이 더욱 중요해지고 있습니다. 특히 시스템이 복잡해질수록 장애 대응에 대한 실무진의 부담은 커지고,서비스 중단에 대한 조직의 리스크 역시 높아질 수 밖에 없습니다.이러한 고민을 해결하기 위해, kt cloud가 오는 7월 7일(화) 오후 2시부터 온라인 세미나를 통해 안정적인 서비스 운영을 위한 클라우드 아키텍처 방향을 소개합니다. 본 세미나에서는 공공·엔터프라이즈 환경의 실제 ..

[Tech Series] kt cloud AI 검색 증강 생성(RAG) #5 : 검색 고도화(Retrieval Optimization)와 리랭킹(Re-ranking) 기술

[ kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 📋 요약 이 글에서는 RAG 시스템의 검색 고도화와 리랭킹을 활용한 실무형 검색 파이프라인 설계를 다룹니다.정확한 근거 문서 확보가 답변 품질과 운영 안정성을 좌우한다는 점을 정리합니다.#RAG #검색고도화 #하이브리드검색 #리랭킹 #AdaptiveRetrieval 들어가며💭안녕하세요! kt cloud 테크 마케터 김지웅입니다. 🙋‍♂️ 지난 1~4편의 연재를 통해 문서를 벡터로 변환하고 빠르게 찾아내는 RAG의 기반 기술들을 차근차근 살펴봤죠. 그런데 그동안의 이야기에는 한 가지 숨은 전제가 있었어요. 바로 ‘인덱싱과 검색 방식이 한 번 정해지면 변하지 않는다’는 정적인 환경을 가정했다는 점입니다. 하지만 현업에서 직접 AI 서..

[기술분석] Kubernetes Gateway API에서 트래픽을 세밀하게 제어하는 Policy 객체 파헤치기

[ kt cloud Container Service팀 박지선 님 ] 📋 요약 이 글에서는 Kubernetes Gateway API의 Policy 객체를 활용해 트래픽 동작을 제어하는 방식과 적용 범위를 다룹니다.운영 환경에서 설정 혼선을 줄이고 안정적인 트래픽 관리를 위한 기준을 정리합니다.#Kubernetes #GatewayAPI #Policy #ClientSettingsPolicy #BackendTLSPolicy 1. 개요이전 편에서 Gateway API 사용해서 Gateway와 HTTPRoute로 기본 라우팅을 구성했다면, 이번 편에서는 Policy 객체로 트래픽을 세밀하게 제어하는 방법을 다룹니다. 타임아웃, 세션 유지, 백엔드 TLS 등 기존 Ingress에서 Annotatio..

[전환가이드] ArgoCD·FluxCD GitOps 배포를 HelmRelease로 전환하는 방법

[ kt cloud Foundation플랫폼팀 이지은 님 ] 📋 요약 이 글에서는 ArgoCD와 FluxCD 기반 GitOps 배포를 HelmRelease 방식으로 전환하는 과정과 운영 시 고려사항을 다룹니다.인프라 배포를 선언적으로 관리해 변경 추적과 운영 안정성을 높이는 방향을 정리합니다.#ArgoCD #FluxCD #GitOps #HelmRelease #Kubernetes 안녕하세요. 지난 글에서 OpenStack Helm 배포를 FluxCD HelmRelease 방식으로 전환한 경험을 공유드렸는데요.이번에는 그 연장선으로 ArgoCD 자체를 동일한 방식으로 전환한 이야기입니다. "배포 도구인 ArgoCD를 ArgoCD+FluxCD로 관리한다"는 다소 순환적으로 들릴 수 있지만, ..

[인사이트] 프롬프트·컨텍스트 엔지니어링 다음은 하네스 엔지니어링: AI 에이전트 환경 설계

[ kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 📋 요약 이 글에서는 AI 에이전트가 실제 업무를 안전하게 수행하도록 실행 환경을 설계하는 하네스 엔지니어링을 다룹니다.모델 성능만으로 해결하기 어려운 운영 안정성과 책임 범위 설정의 중요성을 정리합니다.#하네스엔지니어링 #AI에이전트 #프롬프트엔지니어링 #컨텍스트엔지니어링 #AI운영안정성 안녕하세요! kt cloud 테크 마케터 김지웅입니다. 🙋‍♂️ AI를 활용하는 방식이 빠르게 바뀌고 있어요. 한동안 AI를 잘 쓰는 핵심은 좋은 프롬프트를 작성하는 것이었죠. 어떤 역할을 줄지, 어떤 형식으로 답하게 할지, 어떤 기준을 지키게 할지 구체적으로 지시하는 것이 중요했습니다. 그런데 최근의 AI 에이전트는 단순히 답변만 생성하지 않아..

[운영가이드] Kubernetes 기반 Fault-Tolerant GPU 클러스터 유지 관리

[ kt cloud Foundation플랫폼팀 서준호 님 ] 📋 요약 이 글에서는 Kubernetes 기반 Fault-Tolerant GPU 클러스터의 안정적 운영과 유지 관리 방안을 다룹니다.대규모 AI 인프라에서 장애 대응과 성능 저하 예방이 운영 신뢰성에 미치는 의미를 정리합니다.#Kubernetes #GPU클러스터 #FaultTolerance #Slurm #InfiniBand 생성형 AI와 대규모 언어 모델(LLM) 시대에 고성능 연산에 대한 수요는 일시적인 급증을 넘어, 이제는 거대하고 지속적인 워크로드로 변화했습니다. 수십억 개의 파라미터를 가진 모델을 학습시키는 것은 단순히 계산 능력을 겨루는 일이 아닌, 인프라를 안정적으로 운영하는 레이스와 같습니다. 수천 개의 GPU를 ..