👨‍💻 Tech Story/Tech Inside

[Tech Series] kt cloud AI 에이전트 #1 : 에이전트의 이해와 구성 요소

kt cloud 테크블로그 2025. 3. 11. 18:19

 

 [kt cloud 마케팅커뮤니케이션팀 김지웅 님 ] 

Intro

안녕하세요, kt cloud 마케터 김지웅 입니다. 🙋‍♂️

요즘 AI 기술이 정말 빠르게 발전하고 있죠?

ChatGPT가 등장한 지 얼마 되지 않은 것 같은데, 2025년 들어 AI는 단순한 대화형 어시스턴트를 넘어 더 진화된 형태로 발전하고 있습니다. 특히 주목받고 있는 것이 바로 'AI 에이전트'입니다. 🤖

 

"에이전트라고요? 마블에 나오는 그 요원 말씀이신가요?"

아니요, 여기서 말하는 에이전트는 조금 다른 의미랍니다. 주어진 임무를 스스로 판단하고 수행한다는 점에서는 비슷한 면이 있죠! 현재 우리가 사용하는 ChatGPT나 Claude 같은 AI 어시스턴트들과도 다른, 더 자율적이고 목표 지향적인 특성을 가진 AI를 말합니다. 오늘은 이 흥미로운 AI 에이전트에 대해 자세히 알아보려고 해요. 특히 우리 같은 클라우드 서비스 제공자(CSP)들이 왜 이 기술에 주목해야 하는지, 함께 이야기 나눠볼까요?


"이것도 그냥 챗봇 아닌가요?" 🤔

많은 분들이 AI 에이전트를 "조금 더 발전된 형태의 챗봇"이라고 생각하시는데요, 이는 마치 스마트폰을 단순한 전화기라고 하는 것과 같습니다. 전화기가 통화만 가능했다면, 스마트폰은 카메라, 내비게이션, 인터넷 등 수많은 기능을 통합적으로 제공하죠. AI 에이전트도 마찬가지입니다!

 

AI 에이전트란? 📚

Google의 최신 백서(Google AI Agents White paper)에 따르면, AI 에이전트는 "목표를 달성하기 위해 세상을 관찰하고 주어진 도구들을 활용하여 행동하는 자율적인 AI 시스템"입니다. 혹시 도서관의 사서 선생님이 방문객의 요청을 받고, 책을 찾아주고, 대출해주는 과정을 보신 적 있으시죠? AI 에이전트는 마치 이런 사서처럼 여러 가지 일을 연결해서 처리하는 AI예요. 단순히 책 위치만 알려주는 게 아니라, 전체 도서 서비스 과정을 이해하고 관리하는 거죠.

 

주요 특징 ⭐

이런 AI 에이전트가 가진 특별한 매력, 세 가지를 소개해드릴게요!

첫째로, AI 에이전트는 놀라운 자율성🕊️을 가지고 있어요. 마치 능력 있는 비서가 상사의 일일이 지시 없이도 알아서 업무를 처리하듯이, 인간이 계속해서 개입하지 않아도 스스로 판단하고 행동할 수 있답니다.

 

둘째는 뛰어난 능동성🏃이에요. "이 작업을 완료하려면 다음은 무엇을 해야 하지?"라며 스스로 생각하고 계획을 세우죠. 누군가 구체적으로 지시하지 않아도, 주어진 목표를 향해 차근차근 나아갈 수 있는 거예요. 마치 일 잘하는 동료가 옆에서 알아서 척척 일을 진행하는 것처럼요!

 

마지막으로, 가장 특별한 점은 바로 다양한 도구 활용 능력🔧이에요. 기존의 챗봇들은 대화만 할 수 있었지만, AI 에이전트는 실제로 외부 시스템이나 도구들을 사용해서 필요한 작업을 직접 수행할 수 있어요. 이게 바로 AI 에이전트가 기존 AI 시스템들과 확연히 다른 점이랍니다.


AI 에이전트의 3가지 핵심 구성 요소 🔍

출처: Google AI Agents White paper

 

자, 그렇다면 이런 AI 에이전트는 어떻게 구성되어 있을까요?

Google의 최신 백서(Google AI Agents White paper)에 따르면, AI 에이전트는 크게 세 가지 핵심 요소로 구성된다고 해요.

1. 모델 (The Model) - AI의 '두뇌' 💭

중앙 의사결정자로서 상황을 이해하고 판단하는 AI의 핵심 두뇌를 담당해요.

 

예를 들어, 학생이 "마케팅 관련 책을 찾고 있어요"라고 하면, 사서님은 즉시 상황을 파악하고 이렇게 대응하시죠. "아, 마케팅 레포트 준비하시나요? 3층 경영학 서가에 최신 마케팅 책들이 있어요. 필립 코틀러의 '마케팅 원론'도 있고, 사례 중심의 책도 있는데... 혹시 특정 주제를 찾으시나요?"

 

이처럼 AI 모델은 단순히 정보를 전달하는 것을 넘어, 사용자의 상황을 이해하고, 필요한 정보를 체계적으로 제시하며, 추가적인 요구사항까지 예측하여 대응하는 '똑똑한 비서' 역할을 수행합니다. 고도화된 추론 능력을 바탕으로 더 나은 해결책을 제시하는 거죠! 💡


2. 도구 (The Tools) - AI의 '손과 발' 🛠️

실제 작업을 수행하기 위해 AI가 활용하는 다양한 기능들의 집합체예요.

 

  • Extensions - 똑똑한 검색 도우미 🔍

마치 도서관의 통합검색 시스템과 같아요. "이 책 있나요?" 하고 물으면 우리 학교뿐만 아니라 다른 캠퍼스 도서관까지 모두 검색해주는 것처럼, AI의 Extensions는 외부 시스템과 연결되어 필요한 정보를 실시간으로 가져올 수 있답니다.

  • Functions - 자동화된 작업 처리기 ⚙️

도서관의 자동 대출/반납기나 프린터 같은 거예요. 학생증 찍고 책을 스캔하면 바로 대출되듯이, Functions는 이메일 발송, 일정 등록, 파일 저장 같은 실제 작업들을 자동으로 처리해줍니다.

  • Data Stores - 똑똑한 기억 창고 💾

여러분의 도서 대출 이력을 기억하는 시스템과 비슷해요. "지난번에 빌린 책이랑 비슷한 책을 추천해드릴까요?"라고 말할 수 있는 것처럼, Data Stores는 중요한 정보를 저장하고 필요할 때 활용하여 더 개인화된 서비스를 제공할 수 있게 해줍니다.


3. 오케스트레이션 레이어 - AI의 '작전 본부' 🎯

목표 달성을 위해 모델과 도구들의 활용 순서와 방법을 조정해요.

 

시험 기간의 도서관을 총괄하는 관리자를 떠올려보세요. 열람실 상황을 체크하고, 스터디룸 예약을 조정하고, 야간 운영까지 모든 것을 조율하죠. 오케스트레이션 레이어는 바로 이런 총괄 관리자와 같은 역할을 합니다. 전체 작업의 흐름을 관리하고, 각 도구들을 적재적소에 배치하며, 최종 목표 달성을 위한 전략을 수립하는 거예요.

 

실제로 이렇게 작동해요 💫

예를 들어, 도서관 관리자의 이런 생각 흐름을 보세요.

"오늘은 열람실이 꽉 찼네. 2층 스터디룸도 예약이 많고... 그룹 스터디하는 학생들은 소음이 덜 방해되는 1층으로 안내해드리고, 늦은 시간까지 공부하는 학생들을 위해 야간 편의시설도 점검해야겠다!"

오케스트레이션 레이어도 이처럼 체계적으로 일을 처리합니다.

 

  1. 현재 상황을 종합적으로 분석 📊
    • 어떤 작업이 필요한지 파악
    • 사용 가능한 도구들 확인
  2. 우선순위 설정과 자원 배분
    • 중요한 작업 순서 결정
    • 필요한 도구들을 효율적으로 배치
  3. 전체 프로세스 관리 💫
    • 모든 작업이 순조롭게 진행되는지 확인
    • 필요한 경우 계획을 유연하게 조정

이처럼 오케스트레이션 레이어는 AI 시스템의 '총괄 관리자'로서, 모든 구성 요소들이 조화롭게 작동하여 원하는 결과를 얻을 수 있도록 관리하는 핵심 역할을 수행합니다. 마치 도서관 관리자가 모든 시설과 서비스가 이용자들에게 최적의 환경을 제공할 수 있도록 세심하게 챙기는 것처럼 말이죠! 📚

 

이처럼 AI 에이전트는 고도화된 LLM, 강력한 도구 세트, 그리고 정교한 오케스트레이션 시스템이 유기적으로 결합된 차세대 AI 시스템이에요. 🤝 이런 멋진 조합이 있기에 단순히 대화만 하는 AI를 넘어서서, 실제로 우리의 일상에서 다양한 일들을 처리하고 가치를 만들어내는 진정한 디지털 비서로 성장할 수 있었답니다. ✨


주요 기업별 AI 에이전트 정의 🏢

Google 이외에 주요 기업들의 정의를 살펴보면 그 차이가 더욱 명확해지는데요, 하나씩 알아볼까요?

1. Salesforce의 시각: "자율적 문제 해결사" 🕊️

Salesforce는 AI 에이전트가 고객과 자연스럽게 소통하면서 다양한 업무를 처리할 수 있다고 말하고 있어요. 특히 AI 에이전트는 머신러닝과 자연어 처리(NLP) 기술을 활용해서 고객의 질문을 정확하게 이해하고 답변할 수 있다고 해요.

 

Salesforce에 따르면, AI 에이전트의 가장 큰 장점은 사람의 도움 없이도 스스로 학습하고 발전할 수 있다는 점이에요. 단순한 고객 응대부터 복잡한 비즈니스 문제 해결까지, 점점 더 다양한 영역에서 활용될 수 있다고 설명하고 있어요. 예를 들어, 고객 문의에 대한 단순 응답부터 다단계 프로세스가 필요한 클레임 처리까지, 모든 과정을 자동으로 처리할 수 있답니다.👍

 

2. Anthropic의 관점: "유연한 문제 해결 접근" 🔄

Anthropic은 매우 실용적인 관점에서 에이전트를 두 가지로 구분해요.

  • 워크플로우(Workflows): 미리 정의된 코드 경로를 따라가는 단순하지만 효율적인 시스템
  • 에이전트(Agents): 상황에 따라 프로세스와 도구 사용을 동적으로 결정하는 유연한 시스템

특히 Anthropic은 "필요 이상의 복잡성은 피하자"는 철학을 가지고 있어요. 단순한 문제는 단순하게, 복잡한 문제는 그에 맞는 수준으로 해결하자는 거죠. 이런 실용적인 접근이 현장에서 얼마나 효과적일지 정말 기대되네요. 🤔

3. Meta의 철학: "완전한 자율성을 향해" 🎯

Meta는 마치 인공지능에게 인간다운 능력을 불어넣으려는 것 같아요! 세 가지 핵심 능력을 강조하고 있거든요.

  • 인식(Perception): 주변 환경을 이해하고 상황을 파악하는 능력
  • 소통(Communication): 사용자와 자연스럽게 대화하고 의도를 파악하는 능력
  • 행동(Action): 실제 물리적 환경에서 목표를 달성하기 위한 행동을 실행하는 능력

이는 마치 인간의 기본적인 능력을 본떠 만든 것 같은데요. 특히 실제 물리적 환경과의 상호작용을 강조한다는 점이 특징이에요. 🤜🤛

4. IBM의 실용적 접근: "체계적인 문제 해결자" 📈

IBM은 정말 구체적으로 에이전트의 능력을 정의했어요.

  • 계획 수립 능력: 자기반성과 비판적 사고를 통해 최적의 해결책 도출 (예: 이전 결정의 결과를 분석하고 더 나은 방법 모색)
  • 정보 기억 능력: 대화 맥락부터 과거 상호작용까지 효과적으로 저장/활용 (예: 고객의 이전 요청사항을 기억하여 맞춤형 서비스 제공)
  • 도구 활용 능력: 다양한 외부 시스템과 API를 자유자재로 활용
  • 자율적 행동 능력: 설정된 목표에 따라 독립적으로 의사결정 및 실행

제가 보기에는 이런 구체적인 청사진이 있어서 개발 방향이 더 명확해 보여요! 😊


기존 AI와 무엇이 다른가요? 📊

구분
단일 목적 AI (Narrow AI) 범용 언어 모델 (LLM) AI 에이전트 (AI Agent)
학습 방식
• 지도학습과 비지도학습 중심
특정 태스크에 초점
• 주로 단일 도메인 중심
대규모 자기지도 학습 기반
• 다목적 텍스트 처리 및 생성
• 광범위한 언어 이해 및 적용
강화학습 및 자율학습 통합
• 환경 적응형 학습
• 목표 지향적 의사결정 학습
지식 범위
• 학습된 데이터 기반 지식
• 제한적 실시간 데이터 처리
도메인별 전문화된 지식베이스
방대한 사전학습 데이터 기반
• 다양한 도메인 지식 통합
• 맥락 기반 지식 추론
실시간 정보 수집/통합
• 동적 지식 확장 및 갱신
• 다중 소스 정보 통합 관리
실행 능력
특정 목적 작업 최적화
• 명확한 입출력 패턴 처리
• 전문 영역 내 고성능
고도화된 자연어 처리
• 복잡한 추론/문제 해결
• 다양한 태스크 적응형 수행
복잡한 다단계 작업 조율
• 자율적 계획 수립/실행
• 상황 적응적 문제 해결
도구 활용
사전 정의된 도구 세트
• 특정 환경 최적화 도구
• 정해진 프레임워크 내 사용
외부 API/도구 연동
• 도구 체인 구성/실행
• 목적별 도구 선택/활용
자율적 도구 선택/조합
• 다중 시스템/API 통합
• 도구 체인 최적화/관리
상호작용
구조화된 입출력 처리
• 제한적 맥락 이해
• 정형화된 응답 패턴
자연스러운 대화형 인터페이스
• 장기 맥락 유지/이해
• 상황 적응적 응답 생성
목표 지향적 대화 관리
• 장기적 사용자 의도 이해
• 환경/상황 적응형 상호작용

이렇게 정리된 표를 보면 각 AI 유형의 특징이 한눈에 들어오시나요? 이제 이 차이점들이 실제로 어떤 의미를 가지는지 자세히 살펴볼게요.

단일 목적 AI는 마치 숙련된 전문가 같아요. 특정 분야에서는 뛰어난 성능을 보이지만, 그 범위를 벗어나면 급격히 성능이 떨어지거든요. 예를 들어, 이미지 분류에 특화된 AI는 텍스트 처리는 전혀 하지 못해요.

 

범용 언어 모델은 마치 박학다식한 대화 상대 같아요. 다양한 주제에 대해 대화할 수 있고, 여러 도구도 활용할 수 있죠. 특히 GPT-4와 같은 고급 모델들은 Code InterpreterGPTs를 통해 더욱 진화하고 있어요. Function calling이나 플러그인으로 외부 시스템과 연동하고, 웹 브라우징이나 이미지 생성 같은 다양한 작업도 수행할 수 있게 되었죠.

 

더욱 신기한 건 OpenAI가 최근에 선보인 'Operator' 기술이 있어요. LLM이 스스로 생각하고 행동하는 능력이 한층 강화되어, 복잡한 작업도 자율적으로 처리할 수 있게 되었죠. 이는 LLM이 단순한 대화 상대를 넘어 진정한 AI 에이전트로 발전하고 있음을 보여줘요.

 

AI 에이전트는 여기서 한 발 더 나아가 자율적인 비서처럼 작동해요. AutoGPTLangChain으로 만든 에이전트들은 사용자의 목표를 이해하고 필요한 도구들을 활용해 최적의 해결책을 찾아내죠.

 

하지만 최근에는 범용 언어 모델과 AI 에이전트의 경계가 점점 흐려지고 있어요. ChatGPT PlusClaude 같은 최신 LLM들이 에이전트의 특성을 갖추면서, 단순 대화를 넘어 실질적인 문제 해결이 가능해졌거든요.

 

이런 경계가 흐려지는 현상의 주요 원인을 살펴보면

  1. 아키텍처의 진화
    • OpenAI의 'Operator' 기술처럼 LLM 자체가 에이전트적 특성을 내재화하기 시작
    • 기존 에이전트 프레임워크(AutoGPT, LangChain 등)도 LLM의 고도화된 기능들을 적극 활용
  2. 추론 능력의 발전
    • LLM의 Chain-of-Thought(CoT) 추론 능력이 강화되면서 복잡한 문제 해결 가능
    • 에이전트의 계획 수립(Planning)과 LLM의 추론이 결합되어 더 정교한 의사결정 가능
    • 멀티스텝 추론을 통해 장기적인 목표 달성을 위한 전략 수립 가능
  3. 기술의 융합
    • LLM이 Function calling, 플러그인 등을 통해 외부 도구들과 연동되면서 에이전트의 핵심 특성인 '도구 활용 능력'을 갖추게 됨
    • AI 에이전트의 오케스트레이션 기능이 LLM의 추론 능력과 결합되며 시너지 효과 발생
  4. 사용자 경험의 통합
    • 최종 사용자 입장에서는 이것이 순수 LLM인지 AI 에이전트인지 구분이 모호해짐
    • 실제 문제 해결 과정에서 두 기술의 장점이 자연스럽게 융합

💫 개인적으로는 이런 변화가 정말 흥미진진하다고 생각해요. 더 이상 "이 기술이 뭐다"라고 구분 짓는 게 중요한 게 아니라, "어떻게 하면 이 기술로 우리 삶을 더 편리하게 만들 수 있을까"를 고민하는 게 더 의미 있어 보여요.

 

사례로 보는 차이점 💡

 

이렇게 세 가지 유형의 AI가 같은 질문에 대해 얼마나 다른 수준의 응답을 제공하는지 비교해봤어요. 단일 목적 AI는 단순 데이터만 보여주는 반면, LLM은 맥락을 이해하고 의미 있는 인사이트를 제공하며, AI 에이전트는 한걸음 더 나아가 실행 가능한 구체적인 해결책까지 제시할 수 있죠.

 

지금 보여드린 이 예시들은 각 AI 유형의 특징적인 차이를 명확하게 보여주기 위한 거였어요. 하지만 AI 기술이 빠르게 발전하면서, 특히 최신 LLM들이 에이전트의 특성을 점차 갖춰가고 있어서 이런 경계가 앞으로 더욱 흐려질 것 같네요.

 

앞으로는 이런 통합된 AI 시스템들이 우리 일상에 자연스럽게 스며들어서, 마치 좋은 친구나 동료처럼 우리를 도와줄 거예요. 기술은 계속 발전하겠지만, 결국 가장 중요한 건 이런 도구들을 우리에게 정말 도움이 되는 방향으로 활용하는 거니까요! 😊


1부 마무리: AI 에이전트, 새로운 혁신의 시작 ✨

지금까지 ‘AI 에이전트의 이해와 특징’이라는 흥미진진한 주제로 여러분과 이야기를 나눠봤는데요. 개인적으로는 이 기술이 정말 매력적이라고 생각해요. 단순히 대화만 하는 AI를 넘어서, 마치 똑똑한 비서처럼 스스로 판단하고 행동하는 모습이 너무나 인상적이네요! 특히 Google, Salesforce, Meta 같은 글로벌 기업들이 각자의 방식으로 AI 에이전트를 발전시키고 있다는 점이 흥미로워요. 이런 다양한 접근 방식은 AI 에이전트가 앞으로 얼마나 더 발전할 수 있을지 기대하게 만들죠! 🚀

 

제 생각에는 kt cloud와 같은 CSP에게 AI 에이전트의 등장은 정말 특별한 의미를 가져요. kt cloud 의 강력한 클라우드 인프라와 AI 에이전트의 만남은 고객들에게 완전히 새로운 차원의 지능형 서비스를 선보일 수 있는 기회가 될 것 같네요! ✨

 

다음 편에서는... 📚

 

2부에서는 한 걸음 더 나아가 AI 에이전트의 다양한 유형과 특성에 대해 더 깊이 있게 알아보도록 하겠습니다. 특히 각 에이전트들이 어떤 목적으로 설계되었는지, 어떤 방식으로 문제를 해결하는지, 그리고 실제 비즈니스 환경에서는 어떻게 활용되고 있는지 구체적인 사례와 함께 살펴볼 예정입니다. 🤓

 

단순 반사 에이전트부터 계층적 에이전트까지, 각각의 AI 에이전트가 가진 고유한 특성과 작동 방식을 알기 쉽게 설명해 드리고, 이들이 실제 비즈니스에서 어떻게 가치를 창출하는지 살펴볼게요. 기대해 주세요! 😊

 

감사합니다! 🙏


[관련/출처]

Google AI Agents Whitepaper

IBM APAC AI Outlook 2025 report

Salesforce Agentforce 문서

Anthropic의 'Building Effective Agents' 연구

Embodied Question Answering: A goal-driven approach to autonomous agents

IBM: Enterprise IT Facing Imminent AI Agent Revolution