'AI의 어머니' 페이페이 리는 미래를 어떻게 보고 있나?

reporter-profile
박원익 2025.02.20 05:49 PDT
'AI의 어머니' 페이페이 리는 미래를 어떻게 보고 있나?
페이페이 리 미국 스탠퍼드대 교수가 지난 10일(현지시각) 프랑스 파리에서 열린 ‘AI 액션 서밋(AI Action Summit)’에서 기조 연설을 하고 있다. (출처 : 페이페이 리 교수 X, @drfeifei)

[CEO포커스] 페이 페이 리
①오픈AI가 이끄는 AI 트렌드를 넘어
②인간 증강, 피지컬 AI 시대 열린다… 월드랩스 설립
③AI 거버넌스 3대 원칙: SF 말고 과학을 활용하라

“75년 전 앨런 튜링은 ‘생각하는 기계(thinking machines)’를 상상할 수 있게 했습니다. 하지만 그 상상은 너무 좁고 내부로 향한(inward-looking) 시각이었을지도 모릅니다.”

‘AI 대모’로 불리는 페이페이 리 미국 스탠퍼드대 교수는 지난 10일(현지시각) “오늘날 AI는 사고하는 동시에 행동하는 기계가 될 준비가 돼 있다”며 이같이 말했다. 프랑스 파리에서 열린 ‘AI 액션 서밋(AI Action Summit)’의 개막 기조연설자로 나서 AI의 새로운 시대를 천명한 것이다. 

페이페이 리 교수의 발언은 언어모델(LM), 사고 중심의 AI 기술·산업 흐름에 대한 비판적인 시각에서 비롯됐다. 2022년 11월 오픈AI가 대화형 AI 시스템인 ‘챗GPT’를 출시하며 LLM(대규모 언어 모델)의 가능성을 보여준 것은 사실이지만, 이것이 AI의 전부는 아니라는 것이다.

페이페이 리 스탠퍼드대 교수 (출처 : TED)

①오픈AI가 이끄는 AI 트렌드를 넘어

실제로 현재 AI 연구, 제품 개발의 주류는 오픈AI가 제시하는 방향으로 흘러가고 있다. 사람처럼 말하는 ‘대화형 AI’라는 UX(사용자 경험)가 보편화됐고 2023년 3월에는 GPT-4를 출시, LLM의 멀티모달(Multimodal, 이미지, 동영상 등 다른 데이터 유형을 처리할 수 있는 AI 시스템) 확장 흐름을 주도했다. 

2024년 9월에는 o1 프리뷰, o1-미니를 선보이며 ‘추론(reasoning) 모델’ 열풍을 일으켰다. 여기서 추론이란 논리적 사고 능력을 의미한다. 더 오래, 더 많은 컴퓨팅 자원을 사용해 생각할수록(test-time compute) 더 나은 답을 내놓는 구조가 특징이다. 

o1의 등장 이후 구글 제미나이가 추론 모델을 선보였고, 중국 스타트업 딥시크가 개발한 추론 모델 R1이 화제가 되기도 했다. 가장 최근에는 일론 머스크의 xAI까지 추론 기능을 갖춘 모델(Grok-3 Reasoning Beta)을 공개, 다양한 추론 모델이 우후죽순 등장하는 추세다. 

리 교수는 이에 대해 “인간의 지능에는 여러 측면이 있는데, 그중 하나가 언어 지능”이라고 말한다. 언어가 매우 중요하지만, 언어로만 세계를 이해하고 재현하는 데는 한계가 있다는 주장이다. 

예컨대 LLM에 “자전거를 타고 있는 펠리컨을 SVG(스케일러블 벡터 그래픽스)로 생성하라”고 요청하면 제대로 된 그림을 그리지 못하는 식이다. 이에 대해 오픈AI 창업 멤버이자 테슬라 오토파일럿 팀을 이끌었던 AI 전문가 안드레 카파시는 “LLM은 사람처럼 볼 수 없기 때문에 텍스트(자전거 탄 펠리컨 SVG 생성 요청)로 사물을 배열하는 것을 매우 어려워한다”고 설명했다. 

메타 AI 최고과학자로 활동하는 얀 르쿤 뉴욕대 교수 역시 비슷한 의견을 피력한 바 있다. 그는 지난 1월 다보스 포럼에서 진행한 강연에서 “현재 LLM에는 물리적 세계에 대한 이해 부족이라는 한계가 있다”며 “실제 세계를 관찰하며 학습하는 새로운 AI 아키텍처 패러다임이 등장할 것”이라고 전망했다.

첨단 LLM으로 만든 SVG 결과 (출처 : Andrej Karpathy X 계정, @karpathy)

②인간 증강, 피지컬 AI 시대 열린다… 월드랩스 설립

페이페이 리 교수는 이런 새로운 접근 방식을 주도하는 과학자 중 하나다. 

오늘날의 AI는 언어(language), 공간(spatial), 기기에 탑재된(embodied) 지능을 사용할 수 있으므로 생은 물론 행동하는 기계로서 준비가 돼 있다는 것이다. 리 교수는 “인간을 강화하고, 증강하는 인간 중심의 AI를 구축하는 도전을 고려해야 한다”고 했다. 언어와 사고를 넘어 인간과 함께 물리 공간에서 행동하는 기계, 즉 로봇에 미래가 있다는 의미다. 젠슨 황 엔비디아 CEO가 1월 CES에서 주창한 ‘피지컬 AI’와 같은 맥락이다. 

이런 관점은 그녀가 오랜 시간 연구해 온 ‘컴퓨터 비전’이란 주제와 연결된다. 컴퓨터 비전은 기계가 이미지를 인식, 처리할 수 있도록 하는 기술로 오랜 역사를 가진 AI 연구 분야다. 1959년 신경 생리학자들이 고양이를 대상으로 시작한 실험에서 출발, 1963년에는 컴퓨터가 2차원 이미지를 3차원 형태로 변환할 수 있게 됐으며 1974년에는 텍스트를 인식할 수 있는 광학 문자 인식(OCR) 기술이 도입됐다.

그러나 2010년까지만 해도 컴퓨터 비전은 개와 고양이를 제대로 구분하지 못할 정도로 정확도가 떨어졌고, AI는 가능성보다 한계가 더 많은 것으로 인식됐다. 전환점은 2012년 열린 이미지넷(ImageNet) 대회에서 벌어졌다. 100만 개 이미지를 인식해 정확도를 겨루는 이 대회에서 ‘알렉스넷’이 등장, 압도적인 성능으로 우승하며 이른바 딥러닝(Deep Learning) 혁명이 일어난 것이다. 

흥미로운 건 이 이미지넷 대회를 만든 게 바로 페이페이 리 교수라는 사실이다. 알렉스넷을 설계한 팀은 AI 최고 석학이자 노벨 물리학상 수상자인 제프리 힌튼 토론토대 교수가 이끄는 팀이었고, 오픈AI 공동창업자 중 한 명인 일리야 수츠케버가 이 팀에 속해 있었다. AI 역사를 바꾼 사건, 주요 인물이 모두 이미지넷 대회와 관련 있다. 

리 교수는 여기에서 그치지 않고, 이 아이디어를 발전시켜 2024년 4월 월드랩스라는 스타트업을 설립했다. 그녀는 “시각적 공간 지능(Visual spatial intelligence)’은 언어만큼 근본적”이라며 “지금 우리는 캄브리아기 대폭발의 한가운데에 있다”고 했다. 

멀티모달 LLM 역시 이미지를 인식하고 생성할 수 있지만, 구조적으로 1차원 토큰(텍스트) 시퀀스에 다른 모달리티(양식)를 끼워 맞추는 방식이다. 반면 공간 지능은 처음부터 세계의 3차원적 특성에 중심을 맞춘다.

월드랩스의 AI 모델로 생성한 3D 영상 캡처 (출처 : World Labs)

③AI 거버넌스 3대 원칙: SF 말고 과학을 활용하라

리 교수가 강조하는 또 하나의 아젠다는 ‘AI 거버넌스’다. AI 기술은 무서운 속도로 발전하는 반면, AI를 어떻게 인류에 도움이 되도록 활용할 것인가에 대한 논의는 제대로 이뤄지지 않고 있다는 게 그녀의 생각이다. 

리 교수는 이와 관련, 파이낸셜 타임스 기고문을 통해 “AI 거버넌스에 대한 전반적인 프레임워크가 없다는 점이 놀랍고 경악스럽다”며 “모든 인류에게 혜택이 돌아가도록 가이드라인을 만들어야 할 필요성이 대두되고 있다”고 강조한 바 있다. 

그녀가 AI 관련 정책 결정을 위해 필요하다고 주장한 세 가지 기본 원칙은 다음과 같다. 첫째, SF(사인언스 픽션)이 아니라 과학을 활용해야 한다는 원칙이다. AI 기술 발전으로 지구 종말이 온다던가 아니면 반대로 유토피아가 달성될 것이라고 믿는 건 SF에 가깝다는 지적이다. 리 교수는 “효과적인 정책 수립을 위해서는 과학적인 접근 방식을 활용, 현실을 냉철하게 바라볼 필요가 있다”고 했다. 

이를 위해서는 AI의 기능에 대한 정확한 최신 정보를 공유할 수 있는 도구가 필요하며 미국 국립표준기술연구소와 같은 기관이 역할을 할 수 있을 것으로 봤다. 리 교수는 실제로 스탠퍼드대학에 HAI(인간중심인공지능연구소)를 설립, 정량적 데이터를 기반으로 AI 기술의 최신 동향과 미래 전망을 다루는 ‘AI 인덱스 보고서’를 발간하고 있기도 하다. 

두 번째는 이념보다 실용이 더 중요하다는 것이다. 페이페이 리 교수는 “최상의 거버넌스 정책은 위험을 전술적으로 완화하는 동시에 책임감 있는 실행에 대한 보상을 제공하도록 설계돼야 한다”며 “정책 입안자들은 선의의 노력에 부당하게 불이익을 주지 않으면서도 의도적인 오용을 막는 실질적인 책임 정책을 만들어야 한다”고 주장했다. 

마지막 원칙으로는 AI 생태계를 더 키워야 한다는 점을 꼽았다. 그녀는 “최고의 혁신은 협업을 통해 이뤄진다”며 “정책 입안자들이 오픈 소스 커뮤니티, 학계를 포함한 전체 AI 생태계에 힘을 실어주는 것이 중요하다”고 했다.

월드랩스 공동창업자들. 가장 오른쪽이 페이페이 리 공동창업자 겸 CEO (출처 : World Labs)

페이페이 리는 누구?

페이페이 리 교수는 1976년 중국 베이징에서 태어나 10대 때 미국 뉴저지로 이민 온 중국계 미국인이다. 

그녀의 학문적 여정은 프린스턴 대학교에서 시작됐다. 1999년 물리학 학사 학위를 우수한 성적으로 취득한 후 2001년 캘리포니아 공과대학교(Caltech)에서 전기공학 석사를, 2005년 계산 신경과학 및 컴퓨터 비전 전공으로 전기공학 박사 학위를 취득, 학계에서 두각을 나타내기 시작했다. 이때 쓴 박사 논문(Visual Recognition: Computational Models and Human Psychophysics)은 데이터 기반 AI에 중점을 두게 된 토대가 됐고, 그녀의 경력을 정의하는 주요 주제로 자리 잡았다.

2005년부터 2006년까지 일리노이 대학교 어바나-샴페인(UIUC)에서 조교수로, 2007년부터 2009년까지는 프린스턴대학교 컴퓨터 과학과 조교수로 일하며 기존의 AI 연구 패러다임에 도전하기 시작했다. 당시 이 분야에서는 데이터 품질보다 알고리듬 혁신을 우선시했는데, 리 교수는 대규모의 다양한 데이터 세트가 머신러닝 모델의 정확도를 전례 없이 높일 수 있다는 가설을 세웠다. 

이 통찰력이 이미지넷으로 이어졌다. 2009년 CVPR 컨퍼런스에서 공식 공개된 이미지넷은 1400만 개 이상의 라벨이 지정된 이미지로 구성된 크라우드 소싱 데이터베이스였다. 이 데이터베이스를 바탕으로 2010년에 시작된 대회 ‘ILSVRC(ImageNet Large Scale Visual Recognition Challenge)’는 컴퓨터 비전 알고리듬의 벤치마크가 됐고, 2012년 이 대회에서 알렉스넷(AlexNet)이 우승, 대규모 데이터 세트에서 훈련된 딥 러닝 모델의 우수성이 입증됐다. 2017년 ILSVRC의 분류 정확도는 97%를 넘어서며 인간의 능력을 추월했다. 

2017년 1월부터 2018년 9월까지 스탠퍼드에서 안식년을 보내는 동안에는 구글에서 부사장을 역임하며 구글 클라우드 AI/ML 수석 과학자로 일하기도 했다. 

스탠퍼드 대학교 컴퓨터 과학과의 세쿼이아 교수이자 스탠퍼드 인간 중심 AI 연구소(HAI)의 공동 책임자(Co-Director)를 맡고 있으며 2024년부터는 월드랩스를 공동으로 창업, CEO로서 회사를 이끌고 있다. a16z, NEA 등 실리콘밸리 톱 VC(벤처캐피털)가 월드랩스에 2억3000만달러(약 3000억원)를 초기 투자했다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.