내 PC가 확 바뀐다... AI 에이전트 혁명!

reporter-profile
박원익 2024.05.21 08:14 PDT
내 PC가 확 바뀐다... AI 에이전트 혁명!
AI 기반으로 이미지 표현 방식을 바꾸는 코파일럿+PC ‘리스타일(Restyle)’ 기능 (출처 : 마이크로소프트, 오픈AI/디자인: 김현지)

[위클리AI브리핑] 2024년 5월 14일~5월 20일
‘AI 에이전트의 미래’ 프로젝트 아스트라
오픈AI의 균형이 깨지다… 안전팀 해체
주간 AI 핵심 이슈·의미 총정리

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 프리미엄 리포트 ‘위클리AI브리핑(Weekly AI Briefing)’입니다.

한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 핵심 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 빅테크, 유망 스타트업의 움직임을 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 자세한 내용은 더 알아보기 링크로 확인하실 수 있습니다.

Table of Contents

  • 💻MS, 코파일럿+PC 공개 “디바이스 혁신”

  • 🤖‘AI 에이전트의 미래’ 프로젝트 아스트라 

  • 👷‍♂️오픈AI의 균형이 깨지다… 안전팀 해체

  • 💡이주의 인사이트 

  • ➕더밀크가 주목한 뉴스

💻MS, 코파일럿+PC 공개 “디바이스 혁신”

(출처 : Microsoft)

팩트 요약: 코파일럿+PC에서 AI 에이전트 쓴다

1. 마이크로소프트(MS)는 20일(현지시각) AI용으로 설계된 새로운 윈도우 기반 PC ‘코파일럿+PC’(Copilot+ PC)를 발표했습니다. 

2. 40조 회이상의 초당 연산이 가능한 강력한 칩과 첨단 AI 모델이 탑재됐다는 점이 특징입니다. ‘리콜’(Recall, 회상) 기능으로 PC에서 본 내용을 쉽게 찾아 기억하고, ‘코크리에이터’(Cocreator, 공동창작자) 기능을 활용해 실시간으로 AI 이미지 생성 및 수정을 할 수 있습니다. 이미지 스타일을 바꿔주는 ‘리스타일’(Restyle) 기능도 제공합니다. 

3. 지연시간, 비용, 개인정보 이전이라는 부담 없이 기기 내에서 혁신적 AI 기능을 활용할 수 있다는 점이 강점입니다. 어도비 등 다양한 서드파티(third party, 외부) 앱을 지원하며 모든 코파일럿+PC 키보드에 코파일럿 키를 제공합니다. 몇 주 안에 오픈AI의 최신 모델인 GPT-4o도 사용할 수 있습니다.

왜 중요한가: 

MS는 오는 6월 18일 출시하는 코파일럿+PC를 선보이기 위해 자체 랩톱 브랜드 서피스는 물론 델(Dell), HP, 레노버(Lenovo), 삼성전자, 에이서(Acer), ASUS 등과 협업한다고 밝혔습니다. 

PC 운영체제(OS)인 윈도우와 AI 기술을 결합, 하드웨어 기기 생태계를 다지고 있는 것입니다. 모바일 OS 시장은 애플와 구글이 장악하고 있지만, PC 시장에서는 MS가 62.06%의 점유율로(스탯카운터, 2023년 5월 기준) 1위입니다. 

MS는 PC, 오피스 도구 등을 기반으로 이용자들이 자사 AI 기술을 업무용으로 활용하도록 유도하고 있습니다. 많은 기업 고객을 보유한 클라우드 서비스 AI 통합 역시 MS가 두각을 나타내는 분야입니다. MS가 향후 B2B AI 시장을 얼마나 확보, 성과를 만들어 낼지 지켜볼 필요가 있겠습니다.

👉더 알아보기: AI 그 자체 “맥북보다 58% 빠르다”

🤖‘AI 에이전트의 미래’ 프로젝트 아스트라

Google I/O 2024 현장에서 프로젝트 아스트라를 체험하는 모습. 화면 위에 부착된 카메라로 사물을 인식, 관련 대화를 나눌 수 있다. (출처 : 더밀크 박원익)

팩트 요약: AI, 눈·귀·입과 기억력을 갖다

1. 구글은 14일(현지시각) 캘리포니아주 마운티뷰에서 개최한 ‘구글 I/O 2024’(연례 개발자 컨퍼런스) 기조연설 무대에서 새로운 범용 AI 에이전트(agent, 대리인) ‘프로젝트 아스트라(Project Astra)’를 공개했습니다. 

2. 시연 영상은 구글 픽셀 휴대폰스마트 글래스에서 실행되는 프로젝트 아스트라를 보여줍니다. 이 새로운 AI 에이전트는 기기에 내장된 카메라, 마이크, 스피커를 통해 사람처럼 실시간으로 보고, 듣고, 말할 수 있습니다.

3. 프로젝트 아스트라는 구글의 최신 고성능 멀티모달(Multimodal, 다중 모드) 모델 제미나이 1.5 프로 기반입니다. 구글은 일부 기능을 연내 제미나이 앱, 웹 등 구글 제품에 도입할 예정입니다. 

왜 중요한가: 

프로젝트 아스트라는 나를 대신해 일하는 똑똑한 ‘전문 AI 에이전트’ 시대의 도래를 암시하고 있습니다. 시리, 알렉사, 구글 어시스턴트 같은 음성 비서와는 차원이 다른 능력을 갖췄습니다. 

프로젝트 아스트라는 멀티모달 AI 모델 기반으로 작동하기 때문에 음성 뿐 아니라 이미지를 비롯한 시각 정보까지 이해할 수 있습니다. 비디오 프레임을 지속적으로 인코딩하는 방식으로 동영상 정보도 실시간으로 인식합니다. 

기억력을 갖추고 있다는 점도 큰 혁신입니다. 이용자 데이터, 기억력을 활용하면 진정한 개인화를 구현할 수 있기 때문입니다. 

👉더 알아보기: 프로젝트 아스트라 실제 체험해 보니

👷‍♂️오픈AI의 균형이 깨지다… 안전팀 해체

(왼쪽부터)자쿱 파초츠키 신임 수석과학자, 그렉 브록만 사장, 일리야 수츠케버 전 수석과학자, 샘 알트만 CEO, 미라 무라티 오픈AI CTO (출처 : 출처: 일리야 수츠케버 X)

팩트 요약: 일리야, 오픈AI 떠나... 안전팀 역사 속으로

1. 오픈AI의 공동창업자이자 수석 과학자인 일리야 수츠케버(Ilya Sutskever)는 14일 “오픈AI를 떠난다”고 X(옛 트위터)를 통해 밝혔습니다. 

2. 일리야는 “약 10년 만에 오픈AI를 떠나기로 결정했다. 오픈AI가 샘 알트만 CEO의 리더십 아래 안전하고 유익한 범용일반지능(AGI)을 구축할 것으로 확신한다”고 했습니다. 그의 다음 행보는 아직 알려지지 않았습니다.

3. 와이어드 등에 따르면 오픈AI는 ‘수퍼얼라인먼트(superalignment)’팀을 해체하고, 팀원을 다른 팀으로 재배치하고 있습니다. 이 조직은 일리야가 이끌어 왔던 AI 안전을 위한 팀이었습니다. 

왜 중요한가: 

일리야 수츠케버의 이탈과 수퍼얼라인먼트 팀 해체는 결코 가벼운 이슈가 아닙니다. 오픈AI 내부에서는 회사의 목적, 정체성과 관련한 이견이 계속 존재했고, 2023년 11월 ‘샘 알트만 CEO 축출’이라는 최악의 사태로 번지기도 했습니다. 

일리야의 사임은 샘 알트만의 복귀 후 봉합된 줄 알았던 갈등이 여전히 남아 있었다는 걸 보여줍니다. 수츠케버와 함께 이 팀의 공동 리더였던 얀 리이크(Jan Leike)는 지난 17일(현지시각) X를 통해 사임 사실을 밝히며 “지난 몇 년 동안 오픈AI 내에서 AI 안전 문화와 절차는 반짝이는(shiny) 제품의 뒷전으로 밀려났다”고 토로하기도 했습니다. 

오픈AI에서 기술 및 안전 문제를 총괄했던 일리야의 이탈은 오픈AI의 경쟁력 저하, 그가 만들거나 합류할 기업의 급부상 등으로 이어질 수 있습니다. 일리야와 오픈AI의 향후 행보를 주목해야 하는 이유입니다.

👉더 알아보기: ‘영혼’ 사라진 오픈AI

💡이주의 인사이트

코파일럿+PC ‘리콜’(Recall, 회상) 기능 예시 (출처 : Microsoft 유튜브 캡처)

오늘 다룬 세 가지 이슈에서 한발 더 나아가 더밀크만의 뷰(view)를 제공해 드리는 <이주의 인사이트>코너입니다. 

오픈AI, 구글이 선보인 ‘사람 같은’ AI 에이전트 경쟁이 어떻게 하드웨어 전쟁으로 이어지는지, 애플의 연례 개발자 컨퍼런스 WWDC 2024, 메타의 움직임에 업계의 관심이 쏠리는 배경을 살펴보세요.

👉이주의 인사이트: AI 에이전트 시대 ‘디바이스 4파전’

더밀크가 주목한 뉴스

  • 구글이 공개한 새로운 동영상 생성 모델 비오: 구글이 14일(현지시각) 개최한 구글 I/O 2024에서 새로운 동영상 생성 모델 비오(Veo)를 공개. 60초 이상 1080p 해상도 동영상을 생성할 수 있음. 장면별 스토리보드 생성 및 음악 추가 기능을 갖춘 VideoFX도 추가로 공개.

  • 애플, 시선 추적 등 새로운 접근성 기능 공개: 애플은 15일 장애가 있는 이용자가 눈으로 아이패드, 아이폰을 제어할 수 있는 시선 추적(Eye Tracking) 등 다양한 기능을 선보임. 뮤직 햅틱은 청각 장애나 난청이 있는 사용자에 진동을 전달, 음악을 경험하게 하는 기능.  

  • 오픈AI, 레딧과 파트너십 체결: 오픈AI는 16일 북미 최대 온라인 커뮤니티 레딧과 파트너십을 체결. 레딧의 데이터 API(애플리케이션 프로그래밍 인터페이스)를 통해 실시간 콘텐츠에 접근할 수 있는 내용. 계약 조건을 공개되지 않았으나 구글이 레딧과 체결한 6000만달러와 비슷한 수준으로 추정.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.