2026/03/23 2

[Tech Series] kt cloud AI 검색 증강 생성(RAG) #4 : 임베딩(Embedding)과 벡터 인덱싱 기술

[ kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 📋 요약 이 글에서는 RAG 시스템의 핵심 구성 요소인 임베딩 원리, 다국어 모델 선정 전략,그리고 HNSW·DiskANN·GPU 가속·양자화 등 벡터 인덱싱 최적화 기법을 다룹니다.모델의 표현력과 인프라 검색 효율 사이의 트레이드오프를 이해하는 것이실무 RAG 시스템의 품질과 운영 비용을 동시에 결정짓는다는 점을 정리합니다. #RAG #벡터임베딩 #HNSW #DiskANN #양자화들어가며 💭안녕하세요, kt cloud 테크 마케터 김지웅 입니다. 🙋‍♂️RAG를 구축하다 보면 지난 3편에서 다룬 '청킹' 다음으로 반드시 마주하는 거대한 산이 하나 있어요.“문서를 잘게 쪼개긴 했는데, 이걸 도대체 어떤 기준으로 수치화하고(임베딩), 수억 개..

[인사이트] AI 인프라의 숨겨진 뇌관, 무효전력과 전압 안정성

[ kt cloud DC서부운용센터 서동진 님 ] 📋 요약 이 글에서는 AI 데이터센터에서 발생하는 무효전력(진상 역률)과 이로 인한 페란티 현상,개폐 서지 등 전압 불안정 문제, 그리고 SVC/SVG를 활용한 무효전력 보상 대응 전략을 다룹니다.GPU 서버 중심의 전력 환경이 기존 공장·빌딩과 근본적으로 다른 특성을 가짐을 이해하는 것이안정적인 AI 인프라 운영의 핵심 전제임을 정리합니다.#무효전력 #역률 #페란티현상 #SVG #AI데이터센터오늘은 전기 엔지니어의 관점에서, 왜 AI 데이터센터의 전력 관리가 일반 공장이나 빌딩과 다른지, 그리고 우리가 어떤 보이지 않는 힘(전압 상승, 서지)과 싸우고 있는지를 전기 지식이 부족한 분들도 쉽게 이해할 수 있도록! 죄송하지만! '직장인의 ..