기술 블로그 (Tech) | kt cloud 기술 블로그 (Tech) | kt cloud

  • 홈
  • kt cloud Story
  • Tech Story
  • News

벡터검색 1

[Tech Series] kt cloud AI 검색 증강 생성(RAG) #4 : 임베딩(Embedding)과 벡터 인덱싱 기술

[ kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 📋 요약 이 글에서는 RAG 시스템의 핵심 구성 요소인 임베딩 원리, 다국어 모델 선정 전략,그리고 HNSW·DiskANN·GPU 가속·양자화 등 벡터 인덱싱 최적화 기법을 다룹니다.모델의 표현력과 인프라 검색 효율 사이의 트레이드오프를 이해하는 것이실무 RAG 시스템의 품질과 운영 비용을 동시에 결정짓는다는 점을 정리합니다. #RAG #벡터임베딩 #HNSW #DiskANN #양자화들어가며 💭안녕하세요, kt cloud 테크 마케터 김지웅 입니다. 🙋‍♂️RAG를 구축하다 보면 지난 3편에서 다룬 '청킹' 다음으로 반드시 마주하는 거대한 산이 하나 있어요.“문서를 잘게 쪼개긴 했는데, 이걸 도대체 어떤 기준으로 수치화하고(임베딩), 수억 개..

Tech Story/Tech Inside 2026.03.23
이전
1
다음
더보기
프로필사진

kt cloud 기술 블로그

Tech Innovation, With Customer!

  • 분류 전체보기
    • Tech Story
      • Tech Inside
      • Data Center & Security
      • Cloud Architecture
      • AI Cloud
      • DevOps & Container
      • etc.
    • kt cloud Story
      • Tech Events
      • Team Culture
      • Service Plus+
      • Newsletter
      • Webinar
      • Customer Spotlight
    • News
      • Press Release
      • Promotion

Tag

saas, gpu, AI, KTCloud, Kubernetes, cloud, 케이티클라우드, 클라우드, ai인프라, 쿠버네티스, 클라우드네이티브, 리벨리온, DaaS, IDC, KT Cloud, 컨테이너, AI데이터센터, DevOps, 데이터센터, NPU,

최근글과 인기글

  • 최근글
  • 인기글
기업 홈 Cloud 홈 Dater Center 홈

Copyright © kt cloud Corp. All rights reserved.

  • 기업 홈페이지
  • Cloud 홈
  • G-Cloud 홈
  • Dater Center 홈
  • YouTube

티스토리툴바