kt cloud [Tech blog]

  • 홈
  • kt cloud Story
  • Tech Story
  • News

vLLM 1

AMD MI250 GPU로 vLLM 최적화 하기 (feat. AI SERV)

[kt cloud AI플랫폼팀 최지우 님]    AMD MI250 GPU로 vLLM 최적화하기 최근 대규모 언어 모델(LLM)의 발전과 함께 인공지능 연구 및 상용화 과정에서 GPU의 수요가 급격히 증가하고 있습니다. 특히, NVIDIA는 이 분야에서 시장을 주도하며 AI 연산에 필수적인 GPU 기술을 제공하고 있지만, 수요에 비해 공급이 부족하고 가격이 높아지는 문제가 발생하고 있습니다. 이러한 상황에서 많은 기업과 연구 기관들은 더 경제적이면서도 성능이 뛰어난 대안을 모색하고 있습니다.그 중 하나가 vLLM 프로젝트입니다. vLLM은 LLM 추론 및 제공을 위한 빠르고 사용하기 쉬운 라이브러리입니다. PagedAttention을 이용하여 Key-Value(KV) Cache가 저장되는 메모리를 blo..

Tech Story/AI Cloud 2024.10.14
이전
1
다음
더보기
프로필사진

kt cloud [Tech blog]

Tech Innovation, With Customer!

  • 분류 전체보기 (255) N
    • Tech Story (133)
      • Tech Inside (8)
      • Data Center & Security (12)
      • Cloud Architecture (58)
      • AI Cloud (10)
      • DevOps & Container (40)
      • etc. (5)
    • kt cloud Story (39)
      • Tech Events (1)
      • Team Culture (1)
      • Service Updates (2)
      • Newsletter (23)
      • Webinar (11)
      • Customer Spotlight (1)
    • News (82) N
      • Press Release (77) N
      • Promotion (4)

Tag

쿠버네티스, IDC, cloud, 클라우드, 리벨리온, gpu, 케이티클라우드, KTCloud, DaaS, NPU, saas, Kubernetes, KT클라우드, 데이터센터, container, CSAP, KT Cloud, AI, DR, 컨테이너,

최근글과 인기글

  • 최근글
  • 인기글
기업 홈페이지 Cloud 홈 Dater Center 홈

주식회사 케이티클라우드

  • 기업 홈페이지
  • Cloud 홈
  • G-Cloud 홈
  • Dater Center 홈
  • YouTube

티스토리툴바