누구나 크리에이터 되는 시대… AI 도구 활용법

reporter-profile
박원익 2023.09.26 20:17 PDT
누구나 크리에이터 되는 시대… AI 도구 활용법
언슈퍼바이즈드(Unsupervised, Refik Anadol) (출처 : https://refikanadol.com/works-old/unsupervised/)

[뷰스레터플러스]
말로 영상 만드는 시대 ‘유튜브 AI’
챗GPT발 디자인 혁명 ‘달리3’
생성형 AI 다음은 ‘쌍방향 AI’ 물결

뷰스레터 독자 여러분 안녕하세요. 더밀크 박원익입니다. 

최근 미국 뉴욕 현대미술관(MoMA, 모마)에 전시돼 큰 화제가 된 작품 ‘언슈퍼바이즈드(Unsupervised, 비지도)’를 아시나요? 모마 1층 로비에 설치된 가로 x 세로 7.3미터 대형 미디어월 작품으로 아파트 3층 높이의 크기에 압도되는 작품입니다. 

이 작품이 화제를 모은 건 생성형 AI가 인간의 개입 없이 만들어 낸 추상적 이미지, 영상을 보여준다는 점 때문입니다. 작가 레픽 아나돌(Refik Anadol)은 AI가 모마에 소장된 방대한 작품(13만8151개) 데이터를 학습하도록 한 뒤 이를 기반으로 새로운 시각 이미지를 계속 생성하도록 만들었습니다. 거대한 디스플레이에서 재생되는 영상과 음악을 감상하다 보면 어느새 용암 분출, 모래 폭풍 같은 환상적인 세계로 빠져들게 됩니다. 

AI는 우리 시대 예술가, 크리에이터(creator, 창작자)들을 위한 새로운 팔레트, 붓이 되고 있습니다. 새롭게 쏟아져 나오는 놀라운 성능의 AI 기반 창작 도구들은 크리에이터 산업의 미래를 어떻게 바꿀까요?

말로 영상 만드는 시대 ‘유튜브 AI’

유튜브 AI ‘드림 스크린 (출처 : Youtube)

구글과 유튜브는 선두에서 ‘AI 기반 창작 시대’를 개척 중인 업계 리더입니다. 특히 AI 기술을 활용한 도구를 개발, 누구나 쉽게 창작자가 될 수 있도록 돕는 데 집중하고 있습니다. 

21일(현지시각) 뉴욕에서 열린 ‘메이드 온 유튜브(Made On YouTube)’ 행사에서 발표된 ‘드림 스크린(Dream Screen)’이 대표적 사례입니다. 드림 스크린을 활용하면 누구나 쉽게 유튜브 쇼츠(shorts, 짧은 영상)용 배경 이미지나 영상을 만들 수 있습니다. 

예컨대 ‘커피 마시는 판다(Panda drinking coffee)’를 입력하면 커피잔을 들고 커피를 들이키는 판다 영상이 생기고, 그 영상을 배경으로 추가 촬영을 할 수 있습니다. 특별한 기술이 없더라도 말로 상상을 구현할 수 있게 된 셈입니다.

👉유튜브 4대 AI 도구 총정리

챗GPT발 디자인 혁명 ‘달리3’

달리2(왼쪽)와 달리3(오른쪽) 이미지 품질 비교. “농구 선수의 덩크슛을 성운이 폭발하는 것처럼 유화풍으로 묘사해 달라”는 동일한 프롬프트를 입력해 얻은 결과다. (출처 : OpenAI)

생성형 AI 붐을 일으킨 오픈AI 역시 구글과 비슷한 움직임을 보여주고 있습니다. AI 기술을 활용한 새로운 도구를 제공, 창작의 진입 장벽을 더 낮췄습니다. 

오픈AI가 20일(현지시각) 발표한 3세대 이미지 생성 모델 ‘달리3(DALL·E 3)’의 가장 큰 특징은 AI 챗봇인 ‘챗GPT(ChatGPT)’와 통합이 이뤄졌다는 점입니다. 달리 외에도 ‘미드저니(Midjourney)’, ‘스테이블 디퓨전(Stable Diffusion)’ 같은 다양한 텍스트 기반 이미지 생성 도구가 존재하지만, 사용하기 쉽지 않다는 반응이 많았습니다. 

이미지를 얻기 위해 입력해야 하는 프롬프트(prompt) 작성이 어렵다는 이유입니다. 프롬프트를 사고파는 장터가 우후죽순 생겨나고, 이를 전문적으로 작성하는 ‘프롬프트 엔지니어’라는 새로운 직군이 생겨나는 이유이기도 합니다. 챗GPT와 통합된 달리3는 어떤 변화를 불러올까요?

👉프롬프트 고민 사라진다

생성형 AI 다음은 ‘쌍방향 AI’ 물결

인플렉션AI가 개발한 AI 챗봇 ‘파이(Pi)’ 소개 이미지 (출처 : https://pi.ai/onboarding)

AI 업계에서는 챗GPT와 달리의 통합을 중요한 시그널로 받아들이고 있습니다. 단순 입력/출력이 아니라 ‘상호작용(interaction)’으로 사용자 인터페이스(UI)가 변한다는 건 그만큼 작업이 효율적이고 쉬워진다는 의미이기 때문입니다. 쌍방향 커뮤니케이션은 ‘멀티턴(multi-turn)’ 방식으로 사용자의 피드백을 수집, 더 어려운 문제도 해결할 수 있도록 만듭니다. 

알파고로 유명한 딥마인드의 공동창업자 무스타파 슐레이만 인플렉션AI CEO가 “생성형 AI에 이은 세 번째 물결은 쌍방향(interactive) AI가 될 것”이라고 이야기한 것도 이런 이유에서입니다. 

그는 “AI 분야에서 일어난 첫 번째 물결은 ‘분류’, 두 번째는 ‘생성’이었다”며 “세 번째 인터랙티브 AI는 행동을 취할 수 있다는 게 특징이다. 기술의 역사에서 매우 중요한 순간”이라고 했습니다.

👉쌍방향 AI, 왜 중요한가?

마이크로소프트 AI 도구 코파일럿 (출처 : Microsoft)

언슈퍼바이즈드의 작가 레픽 아나돌은 지식 컨퍼런스 ‘테드(TED)’ 강연에서 “생성형 AI를 공동작업자(collaborator)로 사용하고 있다. 생성형 AI는 새로운 현실을 창조하고, 현실에 투영할 수 있도록 도와준다”고 했습니다. AI가 예술가를 대체하는 것이 아니라 더 많은 일을 할 수 있도록 돕는다는 주장입니다.

기술업계 관계자들 역시 “AI를 막연히 두려워하기보다 적극적으로 활용하는 편이 유리하다”고 이야기합니다. AI는 크리에이터 산업뿐 아니라 모든 영역에서 ‘거스를 수 없는 현실’이 되고 있습니다. 

독자 여러분들도 더밀크가 소개해 드리는 새로운 AI 도구를 한번 활용해 보시면 어떨까요? 더밀크는 계속해서 가치 있는 정보와 인사이트를 취재해 전해드리는 정보, 인사이트의 ‘공동작업자’ 역할을 하겠습니다. 

감사합니다. 

뉴욕에서
더밀크 박원익 드림

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.