머스크노믹스 핵심, 양질의 데이터에 있다

reporter-profile
박원익 2024.05.28 13:41 PDT
머스크노믹스 핵심, 양질의 데이터에 있다
(출처 : xAI, 구글/디자인:김현지)

[위클리AI브리핑] 2024년 5월 21일~5월 27일
다국어 AI 시대 온다 “아키텍처 혁신해야”
자기파괴 시도하는 구글… 현실은 악몽?
주간 AI 핵심 이슈·의미 총정리

안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 AI 뉴스레터 [박원익의 AI인사이트]입니다. 

최근 AI 업계에는 오픈AI GPT-4o 발표구글 I/O마이크로소프트 빌드로 이어지는 뉴스 폭풍이 몰아쳤습니다. 

쉴 새 없이 현장에서 취재하다 보니 시간이 훌쩍 흘렀는데요, 27일(현지시각) 메모리얼 데이(Memorial Day, 미국의 현충일)에 작성하는 오늘 레터는 새로운 소식과 함께 현재 AI 업계가 직면한 중요 이슈를 한차례 돌아볼 수 있는 내용으로 준비했습니다.

Table of Contents

  • 💰머스크의 ‘8조 비전’ = 슈퍼컴퓨터

  • 🤖다국어 AI 시대 온다 “아키텍처 혁신해야”

  • 💻자기파괴 시도하는 구글… 현실은 악몽?

  • 💡이주의 인사이트

  • ➕더밀크가 주목한 뉴스

💰머스크의 ‘8조 비전’ = 슈퍼컴퓨터

(출처 : xAI)

팩트 요약: xAI, 투자유치 완료… 레이스는 이제 시작

1. 일론 머스크의 AI 스타트업 xAI가 60억달러(약 8조2000억원) 규모의 시리즈 B 투자 유치를 마무리했다고 26일(현지시각) 발표했습니다. 

2. 앤드리슨 호로위츠, 세쿼이아 캐피털 등 실리콘밸리 유명 VC(벤처캐피털)가 투자에 참여했습니다. 

3. xAI는 “곧 여러 가지 흥미로운 기술 업데이트와 제품을 공개할 예정”이라며 “인프라 구축, 미래 기술 연구 가속화에 투자금을 사용하겠다”고 밝혔습니다.  

왜 중요한가: 

xAI는 ‘우주 이해(Understand the Universe)’를 회사의 사명으로 내세운 기업입니다. 인류의 과학적 발견을 가속하기 위해 AI를 개발하고 연구한다는 것이죠. xAI의 발전은 테슬라 차량 제조 자동화, 스페이스X의 화성 탐사 및 이주 계획 등과도 밀접하게 연결이 돼 있습니다. 

xAI가 실제로 인류에 공헌할지는 알 수 없지만, 오픈AI의 안전팀이 붕괴된 상황에서 라이벌 격인 xAI에 투자금이 몰렸다는 점은 눈여겨 볼 필요가 있습니다. 일론 머스크는 최근 오픈AI를 떠난 일리야 수츠케버 전 오픈AI 수석과학자를 영입하고 싶다는 의사를 과거 공개적으로 드러내기도 했습니다.

👉더 알아보기: 머스크노믹스의 비밀

🤖다국어 AI 시대 온다 “아키텍처 혁신해야”

주요 AI 모델 언어별 MMLU(다중작업언어이해) 점수 비교표 (출처 : Two Platforms)

팩트 요약: 새로운 아키텍처가 기회 만든다

1. 실리콘밸리 AI 스타트업 투플랫폼(Two Platforms)은 최근 새로운 아키텍처(architecture, 설계) 기반의 AI 모델 ‘수트라(SUTRA)’를 공개했습니다. 

2. 핵심 개념 이해와 언어별 처리를 분리한 ‘듀얼 트랜스포머’ 아키텍처를 사용, 영어 외 다른 언어에서 탁월한 비용 효율성, 성능을 낸다는 점이 특징입니다.

3. 인도에서 사용되는 구자라트어의 경우 GPT-4보다 수트라의 MMLU(다중작업언어이해, 수학·물리학·역사·법률·의학·윤리 등 57개의 주제를 테스트) 점수가 더 높았습니다. 

왜 중요한가: 

영어를 모국어로 사용하는 인구는 전 세계 인구의 20%를 차지하지만, AI 산업에서는 영어가 절대적인 지위를 차지하고 있습니다. 주요 AI 모델 훈련에 사용되는 데이터 세트가 대부분 영어 중심이기 때문입니다. 

이런 불균형 때문에 GPT-4 같은 AI 모델을 API(애플리케이션 프로그래밍 인터페이스)로 유료 이용하는 비영어권 기업들은 손해를 보고 있습니다. 같은 내용을 입력, 출력할 때에도 영어 대비 더 많은 비용을 지불해야 합니다. 

👉더 알아보기: “영어가 왜 AI 전체를 지배하나”… 대안은?

💻자기파괴 시도하는 구글… 현실은 악몽?

비디야 스리니바산 구글 광고 부문 VP가 21일(현지시각) 생성 AI 기술 기반의 새로운 광고 경험에 관해 설명하고 있다. (출처 : Google)

팩트 요약: AI 오버뷰에 광고 도입한 구글, 오류에 곤혹 

1. 구글은 21일(현지시각) AI 요약 답변 ‘AI 오버뷰(Overview, 개요)’에 광고를 도입한다고 밝혔습니다.  

2. 예를 들어 “옷의 주름을 없애는 방법”이라고 구글 검색창에 입력하면 AI 오버뷰 영역에 주름 제거 방식을 설명하는 요약문이 보이고, 바로 아래 영역에 인스타카트나 월마트에서 살 수 있는 주름 제거 스프레이를 보여주는 방식입니다. 

3. 구글이 AI 오버뷰를 도입, 검색 방식을 대대적으로 개편한 건 25년 만의 일입니다. 

왜 중요한가: 

구글은 구글 I/O 2024에서 발표한 대로 기존 검색 사업에 대한 ‘카니발라이제이션(Cannibalization, 자기 시장 잠식)’ 우려에도 웹사이트 링크가 아닌 AI가 생성한 답변을 우선적으로 보여하는 ‘변화’를 택했습니다. 

AI 오버뷰 영역에도 광고를 넣을 수 있다는 판단이 결정에 적잖은 영향을 미친 것으로 풀이됩니다. 자기 파괴(Self disruption)를 하지 않으면 오픈AI 등에 완전히 밀릴 수 있다는 위기의식도 영향을 줬습니다. 문제는 AI 오버뷰 결과에 아직 오류가 많다는 점입니다. “피자 위에 치즈가 잘 안 붙는다”는 질문에 “접착체를 사용하라”는 답변이 달리는 식입니다.

👉더 알아보기: “지키려다 당한다” 구글 전략 변화의 의미

💡이주의 인사이트

Professor Thales Teixeira (출처 : Thales Teixeira)

오늘의 레터에서 다룬 세 가지 이슈에서 한발 더 나아가 더밀크만의 뷰(view)를 제공해 드리는 <이주의 인사이트>코너입니다. 

오늘은 세계적인 전략 마케팅 석학이자 베스트셀러 ‘디커플링’의 저자로도 잘 알려진 탈레스 테이셰이라 교수(UC샌디에이고)의 견해를 전해드립니다. ‘생성 AI 웨이브’에 대한 테이셰이라 교수의 시각을 확인하세요.

👉이주의 인사이트: 테이셰이라 “생성 AI 시대, 비즈니스 격변 중”

코히어 다국어 LLM Aya 23 성능 비교표 (출처 : Cohere)

➕더밀크가 주목한 뉴스

  • 스케일AI, 10억달러 시리즈F 투자 유치: AI 데이터 라벨링(Data Labeling) 스타트업 스케일AI가 21일(현지시각) 10억달러 규모의 시리즈F 투자 유치를 완료했다고 발표. 액셀(Accel), 엔비디아 등 기존 투자자들이 대부분 투자에 참여. 아마존, 메타 등도 새로운 투자자로 합류.

  • 코히어, 다국어 LLM ‘Aya 23’ 출시: 코히어는 22일 23개 언어를 지원하는 다국어 LLM Aya 23을 공개. 파라미터(parameter, 매개변수) 80억 개(8B), 350억 개(35B) 두 가지 버전. 가중치까지 공개한 오픈형 모델. 구글 젬마 7B, 미스트랄 7B, 믹스트랄 8x7B 등 동급 모델 대비 우수한 성능 점수를 기록. 

  • 앤트로픽, 클로드 골든 게이트 버전 공개: 앤트로픽이 23일 AI 챗봇 클로드 골든 게이트(금문교) 버전을 공개. 최근 발표한 연구에 입각해 챗봇이 특정 경향성을 갖도록 조정한 버전. 질문에 관계 없이 교량, 샌프란시스코와 연관된 답변을 내놓음. 앤트로픽은 “(대규모 언어모델)이 어떻게 작동하는지 이해하기 시작했다는 확신을 갖게 해준다”고 밝힘.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.