AI플랫폼 2

[분석] MLOps에서 LLMOps로, 아직 끝나지 않은 진화의 서막

[ kt cloud AI플랫폼팀 최지우 님 ] 📋 요약 이 글에서는 AI 모델 운영의 핵심인 MLOps에서 LLMOps로의 진화 과정을 다룹니다.생성형 AI 시대에 필요한 운영 체계의 변화와 기업이 고려해야 할 실무 관점을 정리합니다.#MLOps #LLMOps #AI운영 #생성형AI #RAGAI 모델을 만들고 배포하는 일은 이제 그 자체로 특별하지 않습니다. 누구나 튜토리얼을 따라 모델을 학습시키고, 몇 번의 시도로 눈에 띄는 성능을 낼 수 있습니다.그러나 모델을 ‘운영’하기 시작하는 순간, 이야기는 완전히 달라집니다. 실제 환경에서 AI는 하나의 모델로 완성되지 않습니다. 데이터 검증, 파이프라인 자동화, 자원 스케줄링, 거버넌스 정책 등이 동시에 맞물려야 합니다. 각 단계는 서로 의..

Tech Story/AI Cloud 2026.01.08

[사례연구] GPU 서버 성능 저하의 숨겨진 원인: 보안 위협 탐지 실전 경험

[ kt cloud AI플랫폼팀 최지우 님 ] 📋 요약 클라우드 GPU 서버에서 발생하는 암호화폐 채굴 문제의 실제 사례와 탐지 방법을 소개합니다.리소스 사용 패턴 분석을 통한 보안 위협 대응 전략을 제시합니다.#GPU서버 #암호화폐채굴 #클라우드보안 #리소스모니터링 #보안위협탐지 GPU 서버를 클라우드 환경에서 제공하는 플랫폼을 운영하다 보면 다양한 유형의 사용 패턴을 마주하게 됩니다. 대부분의 사용자는 인공지능 학습이나 추론 등 본래의 목적에 맞게 GPU를 활용하지만, 일부는 비정상적인 방식으로 리소스를 사용하는 사례도 존재합니다. 그중 대표적인 것이 바로 암호화폐 채굴입니다. 암호화폐 채굴은 계산량이 많은 작업이기 때문에 GPU나 CPU 자원을 장시간 점유하게 됩니다. 이로 인해 해당 인스턴스에서..

Tech Story/AI Cloud 2025.09.03