인공지능이 만드는 회사 홍보 영상! AI 최신 트렌드 체험하기
[kt cloud 서비스개발팀 강상구 님]
인공지능이 만드는 회사 홍보 영상! AI 최신 트렌드 체험하기
최근 GPT의 등장 이후 인공지능(AI)은 전 세계적으로 주목받고 있으며, 다양한 산업에 변화를 이끌고 있습니다. 'AI 분야는 자고 일어나면 신기술이 나와 있다'는 말을 들어본 적이 있으신가요? 한 회사가 새로운 모델을 공개하면 다음 날 경쟁적으로 다른 회사에서 또 새로운 모델을 공개하며 경쟁이 날로 치열해지고 있습니다.
Notion, Adobe 등 기존 서비스 기업들 역시 AI가 적용된 기능을 하나둘 공개하고 있습니다.
대화형 인공지능
‘AI는 ChatGPT다’라고 생각하고 계신가요?
ChatGPT는 대화형 인공지능의 한 종류일 뿐 수많은 기업들이 AI 서비스를 공개하고 있습니다. 여기에는 코드 생성, 동영상 생성, 이미지 생성, 웹 페이지 제작, PPT 및 디자인 작업, 음악 생성, 만화 생성 등 다양한 서비스들이 있습니다.
그럼 대화형 인공지능으로는 무엇을 할 수 있을까요 ? ChatGPT가 똑똑한 건 알겠지만, '그냥 궁금한 거 물어보는 서비스 아니야?'라고 생각하신다면, 어서 ChatGPT에게 더 다양한 업무 지시를 내려보시길 바랍니다.
ChatGPT는 블로그 작성 자동화, YouTube 영상 내용을 요약하는 것은 물론 PDF와 Excel의 내용을 인식하여 설명해 주기도 합니다. 간단한 이미지 생성이나 음성 대화는 물론, 언어 공부도 가능합니다.
그렇다면 대화형 인공지능에는 ChatGPT만 있을까요? MS의 Copilot, Google의 Gemini는 물론 Anthropic의 Claude도 있습니다. Claude는 GPT와 유일하게 비교될 수 있는 서비스로 평가 받습니다. 두 모델을 간단히 살펴보면 아래와 같습니다.
ChatGPT
OpenAI가 개발한 대화형 인공지능 모델은 가장 대중적인 서비스로, 사용자의 다방면적 요청에 대응할 수 있도록 설계되었습니다. 최근 GPT-4o with canvas, Search GPT 등을 업데이트하며 기능을 공격적으로 확대하고 있습니다.
OpenAI의 투자자는 마이크로소프트가 대표적이며, MS는ChatGPT가 사용하는 GPT-4 모델을 Azure를 통해 제공하고 있습니다. Copilot과 Bing AI도 GPT-4를 기반으로 제공하는 것으로 알려져 있습니다.
최근 OpenAI의 샘 알트만은 GPT 학습에 막대한 비용이 필요해 구독료 증가와 추가적인 투자자 모집을 고려하고 있다고 밝혔습니다.
현재 가장 많은 유저가 구독하며 사용중인 대중화된 AI 서비스입니다.
Claude
전 Google 연구원들이 설립한 Anthropic이 개발한 언어 모델인 Claude는, OpenAI가 MS의 투자로 영리화되는 과정에서 의견 충돌로 퇴사한 초기 GPT 개발자들이 주축이 된 만큼 AI의 안정성과 윤리적 사용을 강조하는 접근이 특징입니다.
클로드는 GPT보다 작문이나 언어에 대한 이해도가 더 뛰어나다는 평가를 받고 있습니다.
최근 Claude 3.5 Sonnet과 Haiku를 공개했는데 이제 GPT-4o의 성능을 따라 잡았다고 평가하는 시각도 있습니다. 이와 동시에 Claude Computer Use를 발표하며 화면을 인식해 컴퓨터를 조작하는 서비스도 선보였습니다. (해당 서비스가 공개되자, MS는 논문으로만 공개했던 OmniParser라는 화면 파싱 도구를 바로 공개하며 견제하는 모습을 보이기도 했습니다.)
투자자는 구글과 아마존이 대표적이며, 이는 OpenAI와 MS의 연합 전선에 대응하는 듯한 느낌을 줍니다.
만약 GPT를 대부분 검색에 사용하고 계신가요?
AI 검색 특화 서비스로는 Perplexity, Felo, Genspark 등이 있습니다.
이 중에서 가장 많은 주목을 받고 있는 Perplexity를 살펴보면 다음과 같습니다.
Perplexity
Perplexity는 위에서 말한 GPT-4o, Claude 3.5 Sonnet 등을 언어 모델로 사용하여 AI 기반의 검색 및 답변 서비스를 제공하는 플랫폼입니다.
이 서비스는 대화형 AI 기술과 웹 검색을 결합하여 여러 출처에서 정보를 수집하고 이를 기반으로 답변을 생성하기 때문에, 기존 생성형 AI가 갖고 있던 환각(목적에 맞지 않는 답변) 문제를 많이 개선한 검색 엔진입니다.
Perplexity는 리서치, 마케팅, SEO, 연구, 보고서 작성 등 실시간 데이터와 명확한 출처가 필요한 자료를 탐구할 때 큰 도움이 됩니다.
투자자로는 엔비디아, 소프트뱅크, 도이체 텔레콤 등이 있으며 SKT의 에이닷은 최근 고객들에게 Perplexity 1년 무료 제공 프로모션을 펼치기도 했습니다.
Perplexity의 경우 확실히 어떤 소스에서 정보를 얻었는지 출처와 과정이 명확히 명시되기 때문에 특정 자료를 찾을 때 유용하며, ‘구글의 대항마’라는 수식어로도 불리고 있습니다.
최근 Search GPT 업데이트로 실시간 검색을 제공하기 시작한 ChatGPT와의 경쟁에서 어떤 전략을 펼칠지 궁금하네요.
AI를 활용한 영상 제작
그럼 다양한 AI 서비스를 경험해보려면 어떤 방법이 가장 좋을까요 ?
최근 미국 대선이나 우크라이나,러시아 전쟁에서는 딥페이크를 이용한 AI 영상이 활용되고 있으며 LG유플러스에서는 AI가 만든 영상을 광고로 사용하기도 했습니다.
앞으로 우리는 AI와 면접을 진행하거나, 또는 토론을 하게 될지도 모릅니다. 화면만으로 구분할 수 없는 세상이 점점 다가오고 있기 때문입니다.
저도 AI를 활용해 kt cloud 홍보 영상을 만들어 보며 최신 AI 기술의 트렌드를 경험해 보고자 합니다.
이미지 생성부터 영상 생성까지 단계별로 정리해 보겠습니다.
이미지 생성
동영상을 제작하기 위해 아무것도 없는 상태에서 AI에게 지시하기보다는, 내가 생각하는 이미지를 움직이게 만드는 편이 더욱 원하는 목표에 도달하기 쉬울 겁니다.
이를 위해 이미지 생성 부분에서 가장 선호도가 높은 Midjourney를 이용해 보겠습니다.
Midjourney
미드저니는 AI 이미지 생성 서비스입니다. 사람들에게 많이 알려진 GPT의 DALL-E보다 더 섬세한 작업이 가능하다 평가 받습니다. 아쉽게도 무료로 이용할 수 없고 구독이 필요하니, 체험을 위해서는 DALL-E를 사용하셔도 무방합니다.
DALL-E와 미드저니에 같은 프롬프트를 입력했을 때의 결과값을 살펴보면 다음과 같습니다.
프롬프트
baby lion, child hugging him, they are sitting on the ground in the middle of dry and cracked ground --ar 16:9 |
아기 사자와 그를 안고 있는 아이. 그리고 바닥을 묘사해보겠습니다.
DALL-E 결과물
Midjourney 결과물
프롬프트에 별다른 디테일을 적지 않았음에도, DALL-E에 비해 미드저니는 풍부한 표현이 들어간 결과물을 얻을 수 있습니다.
그럼 이미지 생성에 앞서 어떤 사진이 필요한지 생각해 볼까요?
회사의 미래 성장 가능성을 위해 미래 도시적인 모습과 회사의 이름이 표현되면 좋을 것 같습니다.
우리 회사 홍보 사진으로 자주 쓰이는 DC의 랙 앞에서 찍은 사진도 괜찮을 것 같습니다.
그럼 미래 도시 같은 느낌의 사진을 먼저 만들겠습니다.
프롬프트
A dark background with buildings and a cloud made entirely of light, drawn as glowing lines, as if sketched with light. The cloud floats in the sky with the text "kt cloud" inside, where "kt" is glowing red and "cloud" is in black. The buildings behind are outlined with thin, glowing white lines, creating a minimalist and futuristic cityscape. The scene has a surreal, sketch-like quality, with the glowing lines standing out against the dark background. Shot with a Sony A7R IV, 35mm lens, high contrast, glowing lines --ar 16:9 --stylize 500 |
어두운 배경에 빛으로 만들어진 구름과 빌딩들을 요구하고 kt cloud를 쓰도록 명시해줍니다. 이때 kt cloud 로고에 색을 더하도록 요청합니다.
결과물
미래지향적인 도시 모습을 현실적으로 잘 표현했습니다. kt cloud 글자에는 색을 입히지 못했지만 구름 모양으로 표현해냈습니다.
비슷한 프롬프트를 이용해서 한번 더 생성해봅니다.
프롬프트
A luminous cloud with the text "kt cloud" written in glowing letters, where "kt" is bright red and "cloud" is black. The cloud is suspended in the air with a futuristic cityscape made of glowing buildings in the background. The buildings and cloud have a soft, radiant light that creates a mystical, surreal atmosphere. The scene feels modern and imaginative, with a soft glow around each element. Shot with a Sony A7R IV, 35mm lens, high contrast, soft lighting |
결과물
영화에 나올 법한 CG의 미래 도시 사진이 만들어졌습니다. 하지만 구름의 로고가 실제 구름처럼 만들어져서 회사 이름이 적힌 모습은 어색한 느낌이 있습니다.
그렇다면 첫번째 프롬프트로 만들어진 결과물을 사용하도록 하고 다음으로 데이터 센터 사진도 한 장 만들어보겠습니다.
먼저 사진에 들어갈 인물이 필요하니 인물 사진을 만들어보겠습니다.
프롬프트
A young Korean couple in stylish office attire, facing forward and smiling warmly. Their expressions are joyful and professional, with a simple pastel-toned background that highlights their presence. The pastel colors provide a calm, minimalistic setting, making the couple’s features and friendly smiles the focus of the image. Shot with a Canon EOS-1D X Mark III, 35mm lens, soft lighting, high contrast with a gentle color palette |
한국인 젊은 커플의 웃는 모습을 그리면서 파스텔 톤의 배경을 추가해 부드러운 이미지를 요청했습니다.
결과물
커플을 그리지 못한 첫 번째 결과물을 제외하고는 웃는 모습이 예쁜 동양인 커플의 모습이 생성됐습니다.
차분한 이미지가 가장 어울리는 3번째 결과물을 사용해보겠습니다.
해당 사진의 인물을 활용하기 위해 Image를 Character Ref로 사용하도록 프롬프트를 입력할 때 같이 입력해보겠습니다.
이 인물 사진을 활용해 우리가 자주 접하던 데이터센터의 모습을 요청해봅시다.
프롬프트
A clean and organized data center, with rows of server racks and neatly arranged cables in the background. A man and a woman, both smiling, stand in the center. The woman is holding a white sign that reads the phrase "Let's go kt cloud" with "kt" in red and the rest in black, all written as a single sentence. Both have attractive Korean facial features, and their expressions are friendly and welcoming. The lighting is bright but soft, adding a clean, professional feel to the scene. Shot with a Sony A7R IV, 35mm lens, high resolution, vibrant colors |
깔끔한 데이터 센터를 배경으로 랙과 케이블이 보이도록 설정합니다. 그리고 중앙에 남녀 한쌍이 미소지으며 서있도록 요청합니다. 아까 입력했던 것과 같이 kt cloud를 넣도록하며 이때 Let’s go kt cloud 문구가 써있는 팻말을 들고 있도록 요구 사항을 추가했습니다.
조명을 밝고 부드러운 느낌으로 요청했습니다.
결과물
결과물을 살펴보니 아직 글자를 구현하는 것은 완벽하지 않은 모습을 보여주네요. 프롬프트에서 요구한 글자를 정확하게 인식하지 못한 모양입니다. 미드저니는 풍경이나 그림 부분에서는 완벽하지만 손가락이나 글자에서는 아직 부족한 모습을 보입니다.
4개의 결과물 중에서 마지막 결과물이 가장 우리 회사 홍보물에서 자주 보던 구도와 비슷하니 이를 활용해봅시다.
사진을 선택하고 Editor에 들어가 해당 사진에서 팻말의 문구를 지우고 다시 수정하도록 요청해봅니다. 문구를 정확히 인식하도록 이번엔 문구의 색상 요구 사항도 삭제하겠습니다.
Editor를 통해 사진과 프롬프트 수정 요청
결과물
두번째 결과물에서 드디어 문구가 제대로 나왔습니다. 해당 사진을 사용하도록 하겠습니다.
이제 사진들을 활용한 동영상 생성으로 넘어갑니다.
동영상 생성
동영상 생성에는 Runway 서비스를 이용하겠습니다.
Runway는 Kling, Luma, Pika 등의 AI 동영상 생성 서비스 중 가장 많은 인지도를 가지고 있습니다.
Runway도 무료 기능은 제공하고 있지 않습니다. Credit을 충전하고 동영상을 생성해보겠습니다. (Kling, Pika의 경우 매일 무료 credit을 제공하니 체험해보는 것을 추천 드립니다.)
Runway
Runway에는 사진과 같이 여러 기능들이 있지만 지금은 Generative Video 기능을 사용해 Image to Video를 구현해보도록 하겠습니다.
프롬프트
Runway의 프롬프트에는 클로즈업이나 드론 촬영 등의 입력이 가능합니다. 하지만 이번에는 사진에 생동감을 불어넣도록 간단하게 도시 전경을 보여주도록 입력하고 생성해보겠습니다
.
동영상 생성의 경우 프롬프트로 많은 지시를 하기보다 AI에게 해석을 맡기는 편이 더 자연스러운 경우가 많았습니다. 간단한 프롬프트만 넣겠습니다.
결과물
별다른 프롬프트를 적지 않았음에도 점점 멀어지며 도시의 전경을 보여주는 영상이 만들어졌습니다. 살짝 로고의 움직임이 어색하지만 풍경은 잘 표현된 것 같습니다.
그런데 영상에 소리가 없으니 무언가 아쉽네요. 이런 영상에 어울리는 노래도 있으면 좋을 것 같습니다.
음악 생성
음악 생성에서는 Suno ai 서비스를 이용해보겠습니다. Suno는 무료로도 체험 가능하니 여러가지 음악을 만들어 보시는 걸 추천 드립니다.
Suno
Suno에게 가사 없이 음악을 만들도록 요청해봅시다.
프롬프트
melodic,trombone,saxophone,jazz,trumpet |
일반적으로 위와 같이 원하는 장르와 악기를 입력하여 원하는 분위기는 연출하도록 지시합니다. 하지만 지금 원하는 악기나 스타일보다는 곡의 분위기만 정해진 상태이니 Suno에게 상황을 설명하고 어울리는 음악을 만들도록 지시해보겠습니다.
(위 프롬프트 결과는 글 하단 Suno 예시 결과물로 첨부했습니다.)
Create commercial music for an IT company |
결과물
광고 음악에 쓰이기 좋은 미래 지향적인 느낌이 드는 음악이 잘 만들어진 것 같습니다.
그럼 Runway에서 만든 영상들에 음악을 추가 해볼까요 ?
영상 편집 툴을 이용해 Runway에서 만든 영상들에 Suno의 음악을 넣어보겠습니다.
최종 결과물
AI 서비스를 이용해 만든 kt cloud 홍보 영상을 감상해봅시다.
유튜브 인트로에 넣기 좋은 영상도 만들어봤습니다.
Runway의 표현 방식을 더 살펴볼 수 있도록 두 영상도 첨부합니다.
똑같은 방식으로 사진과 영상, 노래를 제작하고 편집했습니다.
다음은 Suno로 만든 음악 샘플입니다.
마무리
AI 서비스는 데이터 베이스를 통한 대화와 검색을 넘어 다양한 분야에서 다가오고 있습니다.
그림과 그래픽 작업에 지식이 없던 사람이 영상을 만들 수 있도록 도와주거나 코드 지식이 없는 사람이 애플리케이션을 만들고 배포할 수 있는 세상입니다.
AI 기술은 이처럼 우리의 생각보다 훨씬 빠른 속도로 발전하고 있습니다.
앞으로 또 어떤 서비스가 나오고 어떤 방향으로 발전할지 모르지만 빠르게 변하는 IT 세계에서 AI의 활용으로 우리의 업무를 더 효율적으로 바꿀 수 있는 기회가 있기를 바라며 이 글을 마칩니다.
참고/출처
https://chatgpt.com/
https://claude.ai/new
https://www.perplexity.ai/
https://www.midjourney.com/
https://app.runwayml.com/
https://suno.com/
Adobe. (2024, Oct 16). #ProjectTurntable | Adobe MAX Sneaks 2024 | Adobe [Video]. YouTube. https://youtu.be/gfct0aH2COw?si=S_ceEkkxPN110cq3