엔비디아 '베라 루빈' 등장... 세상은 이렇게 바뀐다

reporter-profile
손재권 2026.03.23 18:01 PDT
엔비디아 '베라 루빈' 등장... 세상은 이렇게 바뀐다
젠슨 황 CEO가 GTC 2026에서 삼성전자에 방문 '그록이 매우 빠르다'고 사인을 남겼다 (출처 : 더밀크 손재권)

[GTC 2026] 베라 루빈 플랫폼의 의미 ①
-컴퓨터, ‘창고’에서 ‘토큰을 생산하는 공장’으로 바뀌다
-AI는 에이전트 스케일링 단계에 진입하며 컴퓨트 수요 폭발
-베라 루빈은 칩이 아니라 AI 팩토리를 위한 첫 통합 인프라 플랫폼
-목수도 AI를 활용하여 건축가가 되고, 회계사도 재무 자문가가 되는 시대가 온다

컴퓨터는 이제 토큰을 제조하는 공장이다. 그 공장의 수가 얼마나 필요한지 알고 싶으면 수조 달러 단위로 생각해야 할 것이다
젠슨 황 엔비디아 CEO, GTC2026 기자회견에서

미국 캘리포니아주 산호세에서 지난 17일 GTC 2026 기자회견장에서 젠슨 황 엔비디아 CEO는 이렇게 말했다. 지난해까지만 해도 그는 기조연설에서나 기자회견장에서나 '칩'을 들어올렸다. 올해는 달랐다. 거대한 칩 세트를 들어 올리면서 기가와트 규모의 거대한 AI 팩토리를 언급했다. 이것이 '베라 루빈(Vera Rubin)'을 이해하는 출발점이다.

젠슨 황 CEO는 렉스 프리드만과의 팟캐스트에서 GTC 2026 기조연설에서 강조하고 싶었던 내용을 자세히 설명했다.

그는 "과거 컴퓨터는 창고(warehouse)였다. 데이터를 쌓아두는 곳이다. 이제 컴퓨터는 공장(factory)이다. 가치 있는 것을 생산하는 디바이스다"고 말했다. 창고는 수익성이 낮다. 공장은 회사의 수익과 직결된다. 이 비유 하나가 엔비디아가 왜 지금 이 시점에 베라 루빈을 만들었는지를 설명한다.

베라 루빈은 올해 3분기부터 파트너사를 통해 본격 공급된다. 이미 앤트로픽, 메타, 밋흐트랄, 오픈AI 등 주요 AI 랩들이 채택 의사를 밝혔다. 그런데 이 플랫폼에 대한 반응은 단순한 신제품 출시 때와 다르다.

"게임체인저"라는 표현이 넘쳐난다. 왜 그럴까? GPU 칩 하나를 더 빠르게 만든 것이 아니기 때문이다. AI가 실제로 작동하는 방식이 근본적으로 바뀌는 시점에, 그 변화에 맞춰 인프라 전체를 처음부터 다시 설계한 플랫폼이기 때문이다.

👉“AI가 AI를 고용한다”… GTC 2026이 보여준 충격적 미래

베라 루빈(Vera Rubin)
엔비디아가 2026년 공개한 차세대 AI 슈퍼컴퓨팅 플랫폼의 이름. 개별 칩 이름이 아니라 베라(Vera) CPU + 루빈(Rubin) GPU 세대를 아우르는 전체 AI 인프라 플랫폼 브랜드다
젠슨 황 엔비디아 CEO가 GTC 2026에서 베라 루빈 플랫폼을 선보이고 있다 (출처 : 엔비디아)

GTC2026의 의미 : AI의 세 번째 진화를 밝히다

베라 루빈을 이해하려면 젠슨 황 CEO가 AI의 진화를 어떻게 보는지를 먼저 알아야 한다. 그는 AI 스케일링의 네 단계를 명확하게 구분했다. 이 네 단계를 이해하면, 왜 지금 이 시점에 베라 루빈 같은 플랫폼이 필요한지가 자연스럽게 드러난다.

첫 번째 단계는 사전 학습(Pre-training) 스케일링이다. 인터넷의 글을 수천억 개 읽혀서 기초 지식을 쌓는 단계다. 더 많은 데이터로 더 큰 모델을 훈련시킬수록 AI가 똑똑해진다는 법칙이 이 단계를 지배한다. 초기에는 고품질 데이터가 고갈될 것이라는 우려가 있었지만, AI가 합성 데이터를 스스로 생성하면서 이 문제는 해결됐다. 황의 말처럼 지금 AI 학습을 제한하는 것은 데이터가 아니라 컴퓨팅 능력이다.

두 번째 단계는 사후 학습(Post-training) 스케일링이다. 기초를 쌓은 AI에게 "이렇게 대답하면 좋고, 저렇게 하면 나쁘다"는 피드백을 줘서 다듬는 단계다. 인간의 피드백을 활용해 AI가 더 유용하고, 더 안전하고, 더 자연스럽게 대화할 수 있도록 정교하게 조율하는 과정이다. 챗GPT가 처음 등장했을 때 사람들이 "이게 AI인가?" 하고 놀란 이유가 바로 이 사후 학습 덕분이었다.

세 번째 단계는 테스트 타임 스케일링(Test-Time Scaling)이다. 답을 내놓기 전에 AI가 스스로 여러 번 생각하게 하는 방식이다. 오픈AI의 'o1' 모델 이후 모든 주요 AI 서비스가 수학 문제나 복잡한 추론을 다룰 때 "잠깐, 다시 생각해보자"를 반복하는 것이 대표적인 예다. 황은 이 단계에 대해 "추론은 사고(Thinking) 과정이다. 단순한 암기나 패턴 인식이 아니라 추론하고 계획하고 탐색하는 것이기 때문에 훨씬 더 컴퓨팅 집약적이다." 생각하는 시간이 길어질수록 더 좋은 답이 나오지만, 그만큼 연산 자원이 더 많이 필요하다.

네 번째이자 지금 막 시작된 단계가 황이 GTC 2026에서 선언한 '에이전트 스케일링(Agentic Scaling)'이다. 이것을 이해하는 가장 쉬운 방법은 회사의 조직도를 떠올리는 것이다. 예전 AI는 혼자 일하는 직원 한 명과 같았다. 사용자가 질문하면 혼자 생각해서 답을 냈다. 그런데 에이전트 AI는 팀장처럼 움직인다. "이 보고서 작성해줘"라는 요청을 받으면, 팀장 AI가 조사 담당 AI를 부르고, 조사 AI는 데이터 분석 AI를 부르고, 분석 AI는 문서 작성 AI를 부른다. 그 결과물들이 다시 팀장 AI에게 모여 최종 보고서가 완성된다.

이것이 바로 황이 "AI가 다른 AI와 대화하면서 컴퓨트 수요를 폭발적으로 키운다"고 말한 것의 실제 의미다.

사용자는 버튼 하나를 눌렀지만, 뒤에서는 수백, 수천 번의 AI 연산이 연쇄적으로 일어난다. 황 CEO는 이 구조를 이렇게 설명했다. "하나의 에이전트가 여러 하위 에이전트를 생성하여 대규모 팀을 구성할 수 있으며, 이는 AI를 확장하는 완전히 새로운 방법이다. 에이전트 스케일링이 만들어내는 데이터는 다시 사전 학습과 추론 스케일링으로 이어지는 선순환 구조를 형성한다."

이 네 번째 단계가 오면 인프라에 요구되는 것이 완전히 달라진다. 에이전트는 외부 도구를 호출하고, 코드를 실행하고, 데이터베이스를 조회하고, 이전 대화와 작업 결과 전체를 기억하고 있어야 한다. GPU뿐 아니라 CPU, 메모리, 저장장치, 네트워크 모두에 전혀 다른 종류의 부하가 걸린다. 지금까지의 AI 인프라는 이 수요를 위해 설계되지 않았다.

베라 루빈은 바로 이 문제를 정면으로 겨냥한 첫 번째 플랫폼이다. 엔비디아가 행복한 비명을 지르는 이유이기도 하다.

👉"AI의 99%는 새로운 수요"… 젠슨 황, GTC에서 AI 버블 논쟁 끝내다

젠슨 황 CEO가 GTC2026 기조연설에서 밝힌 4대 AI 스케일링 법칙 (출처 : 더밀크, 엔비디아)

왜 엔비디아의 진짜 해자는 쿠다와 코디자인인가?

컴퓨팅 플랫폼의 성공은 개발자 유치에 달려 있다. 개발자는 설치 기반이 큰 플랫폼에 모인다. 개발자는 많은 사람에게 도달할 수 있는 소프트웨어를 개발하기를 원하기 때문이다.
젠슨 황 엔비디아 CEO, GTC2026 기자회견에서

젠슨 황 CEO는 GTC2026 기자회견과 팟캐스트에서 엔비디아의 가장 중요한 경쟁 우위는 쿠다(CUDA) 라고 밝혔다. 베라 루빈 같은 최신 하드웨어가 아니라는 것이다.

기조연설에서는 '쿠다 20주년'에 대한 설명을 장황하게 하고 의미 부여를 했을 정도로 엔비디아가 현재 글로벌 1위 시가총액으로 올라서게 만든 기술이기도 하다.

그는 "소프트웨어 오픈 플랫폼인 '쿠다' 를 지포스(GeForce)에 탑재(2006년)하는 것은 당시 회사 수익에 막대한 손실을 초래할 수 있는 결정이었다. 실제로 엔비디아의 시가총액이 크게 하락했다"며 "엔비디아는 컴퓨팅 회사로서 모든 칩에 호환되는 컴퓨팅 아키텍처를 구축하기 위해 이 결정을 강행했고 이것이 AI 인프라 세계에서 딥러닝 혁명의 플랫폼이 됐다"고 회고했다.

현재 쿠다는 13번째 버전이다. 젠슨 황 CEO는기자회견에서 오픈소스 AI 모델인 네모트론(Nemotron)에 번호를 붙이는 이유를 "숫자를 붙이는 것은 계속하겠다는 의도를 담는 것이다. CUDA 1을 만들고 지금은 CUDA 13이다. 그것이 답이다."고 말했다.

개발자들은 쿠다를 사용하면 6개월마다 성능이 10배 향상되고, 수억 명의 사용자에게 도달할 수 있으며, 모든 클라우드와 모든 산업에서 활용될 수 있다고 믿는다.

엔비디아가 쿠다를 지속적으로 유지, 개선, 최적화할 것이라는 신뢰가 있다. 이 신뢰가 쌓인 생태계를 단기간에 무너뜨리기는 매우 어렵다. AMD가 기술적으로 경쟁력 있는 제품을 내놓아도 엔비디아의 지배력이 유지되는 이유가 여기에 있다.

*엔비디아와 젠슨 황은 GTC2026 기조연설에서 쿠다 20주년 헌정 영상을 상영했을 정도로 의미부여했다.

젠슨 황 CEO는 팟캐스트에서 엔비디아의 핵심 경쟁력을 설명하면서 익스트림 코디자인(extreme co-design, 극한 공동 설계)이라는 개념을 반복해서 강조했다. 이것이 베라 루빈을 이해하는 두 번째 열쇠다.

젠슨 황 CEO는 "AI 시대 들어서 하나의 컴퓨터나 GPU로 가속할 수 없을 만큼 복잡해졌다. 훨씬 빠르게 문제를 해결하려면 알고리즘을 분해하고 데이터를 분할해야 한다. 컴퓨팅만 빠르다고 끝나지 않는다. 네트워킹, 스위칭, 워크로드 분배, 메모리, 냉각, 전력 공급 등 모든 요소가 병목기 됐다"고 극한 공동 설계 과정이 AI 처리의 핵심이 된 이유를 설명했다.

젠슨 황은 GTC 2026을 마친 후 엔비디아 본사에서 가진 렉스 프리드먼과의 인터뷰에서 "30년 전부터 '광속(Speed of Light)'이라는 철학으로 일해왔다"고 밝혔다. 물리학적으로 가능한 한계를 먼저 파악하고, 그 한계에서 거꾸로 시스템을 설계하는 방식이다. 점진적인 개선보다 처음부터 물리적 한계에 도전하는 것을 선호한다.

이 철학이 베라 루빈의 설계 전반에 관통했다. 소프트웨어 스택 전체(아키텍처, 칩, 시스템, 알고리즘, 애플리케이션)부터 CPU, GPU, 네트워킹 칩, 스위치, 전력 공급, 냉각 시스템까지 모든 것을 동시에 최적화한다. 이것이 극단적인 공동 설계다.

메모리도 마찬가지였다. 엔비디아는 '베라 루빈' 플랫폼 부터 메모리를 HBM 뿐 아니라 LPDDR 등 다양한 메모리를 혼합해 사용했다. AI 연산에서 메모리는 단순한 저장소가 아니기 때문이다. 단기, 중기, 장기 기억을 모두 메모리에 담아야 한다.

그는 "다른 데이터센터 CPU는 DDR 메모리만 사용하는데, 대역폭 대비 에너지 효율이 매우 떨어진다. 엔비디아는 그레이스(Grace) CPU에서 LPDDR4를 처음 도입했을 때 혁명적이었다. 베라(Vera) CPU는 LPDDR5을 사용하고 앞으로 나올 로사(Rosa) CPU는 LPDDR6다"고 말했다.

젠슨 황 CEO가 기자회견에서 강조한 것은 '실리콘 포토닉스와 CPO(Co-Packaged Optics)'도 TSMC와의 익스트림 코디자인을 통해 만들어냈다. 실리콘 포토닉스는 전자 대신 빛(광자)을 이용해 데이터를 전송함으로써 이 병목을 해소한다. CPO는 이 광자 엔진을 칩 패키지 안에 직접 통합하는 기술이다.

그는 "우리는 TSMC와 함께 CPO를 공동 발명했다. 전자(electronics)와 실리콘 포토닉스 엔진을 하나의 실리콘 위에 직접 통합한것이다. 전체 공급망에 걸쳐 약 100개의 특허를 출원했고, 우리의 기술을 전체 공급망에 라이선스했다"고 밝혔다.

TSMC와 공동 발명하고 100개의 특허를 출원했다고 밝힌 것은, 이 기술이 단순한 부품 구매가 아니라 엔비디아의 핵심 지식재산임을 의미한다. 황 CEO의 반도체 관련 발언들을 종합하면 하나의 일관된 메시지가 나온다. 반도체 경쟁의 기준이 '칩 단위 성능'에서 '시스템 전체의 공동 디자인'으로 이동했다는 것이다.

공정 미세화가 주도했던 무어의 법칙의 시대는 사실상 끝났다. 향후 반도체 성능 향상은 칩과 GPU, CPU, LPU는 물론 메모리와 인터커넥트와 소프트웨어를 하나의 통합된 시스템으로 설계하는 역량에서 나온다.

👉‘AI의 왕’ 즉위식 된 젠슨 황 GTC 2026 기자회견

엔비디아의 '극한 공동설계(익스트림 코디자인)'을 통한 향후 AI 플랫폼 로드맵. 올해 '베라 루빈'에 이어 내년 '루빈 울트라' 2028년엔 '파인만'이 공개될 예정이다. (출처 : 더밀크, 엔비디아)

2028년, 파인만이 온다

엔비디아는 제품 출시 주기를 1년 단위로 단축하며 기술적 격차를 벌리고 있다. 2026년 베라 루빈을 시작으로, 2027년에는 성능이 강화된 '루빈 울트라(Rubin Ultra)', 2028년에는 완전히 새로운 아키텍처인 '파인만(Feynman)'으로 이어지는 공격적인 로드맵을 제시했다.

2027년 출시하는 루빈 울트라는 단일 GPU 패키지에 4개의 연산 다이를 탑재하고, 1TB 용량의 HBM4E 메모리를 적용하여 성능 밀도를 두 배로 높일 예정이다.

2028년 공개하는 파인만은 NVLink에 본격적으로 실리콘 포토닉스가 통합돼 1,152개의 GPU가 하나의 도메인으로 묶이는 초거대 컴퓨팅을 목표로 한다.

젠슨 황 CEO는 렉스 프리드먼 팟캐스트 말미에 10년 후 엔비디아를 "75,000명의 직원이 750만 개의 에이전트와 함께 일하는 회사. 에이전트들은 24시간 돌아간다"고 설명했다.

그리고 그 세계에서 인간의 역할에 대한 철학도 밝혔다. "방사선과 의사 직업이 AI로 사라질 것이라고 예측했지만, 실제로는 방사선과 의사의 수가 오히려 증가했다. AI가 진단 속도를 높여 더 많은 환자를 진료할 수 있게 했기 때문이다. AI는 직업의 목적을 바꾸는 것이 아니라, 그 목적을 달성하기 위한 도구와 과업을 변화시킨다."

황은 '지능(Intelligent)이 곧 상품(Commodity)' 될 것임을 예측했다. "AI가 지능을 상품화함으로써, 우리는 인간성의 가치를 더욱 높이 평가하게 될 것이다. 인간성은 고통에 대한 인내, 결단력, 연민, 관대함 등 지능과는 다른 훨씬 더 큰 개념이다."

이어 "코딩의 정의가 명세(Specification)를 작성하는 것으로 바뀌면 코딩할 수 있는 사람의 수가 3000만 명에서 10억 명으로 늘어날 것이다"라고도 했다.

목수도 AI를 활용하여 건축가가 되고, 회계사도 재무 자문가가 되는 시대가 온다. 아니 이미 왔다.

👉 젠슨 황, "AI가 도로를 달리고 우주를 연다"...4대 수혜주 분석

젠슨 황 CEO가 GTC26 기조연설에서 휴머노이드 생태계를 확장하고 있는 엔비디아의 영향력을 소개하고 있다. (출처 : 엔비디아)

베라 루빈은 왜 게임 체인저인가? 2026년 이후 세상은 어떻게 바뀌나?

베라 루빈이 본격적으로 출하되고 AI 데이터센터 및 각 AI 팩토리에서 본격적으로 AI 토큰을 생산하는 순간부터 산업의 모습은 크게 달라진다.

토큰당 비용이 10분의 1로 떨어지면 지금은 '비싸서 못 만드는' 서비스들이 쏟아지기 때문이다. AI 기능이 없는 서비스가 오히려 예외가 된다.

엔비디아는 이를 위해 GPU(루빈), CPU(베라), 네트워킹(스펙트럼-6), 인프라 관리(블루필드-4), 특화 추론 가속기(그록3)까지 아우르는 수직 계층을 단일 플랫폼으로 묶었다. 극단적인 공동 설계의 결정판이다. 그리고 이 위에 30년 동안 쌓아온 쿠다 생태계가 해자(Moat)로 작동한다.

젠슨 황 CEO "AI 공장은 생산하는 상품(토큰)은 가치 있고 수익을 창출"하며, 아이폰처럼 다양한 가치로 세분화된 토큰 시장이 형성된다. AI 경제성의 전환점이다. 창고에서 공장으로 바뀐 컴퓨터가 처음으로 진정한 수익 창출 자산이 되는 변곡점이다.

MS 윈도우가 ‘모든 PC의 공통 운영 환경’을 제공하며 소프트웨어 생태계를 폭발시켰고 아이폰이 ‘손 안의 컴퓨터’를 표준화하며 모바일 앱 경제를 열었다면, 베라 루빈은 ‘AI 토큰 공장’을 표준화하는 인프라 플랫폼에 가깝다. 윈도우·아이폰이 인간과 컴퓨터의 접점을 바꿨다면, 베라 루빈은 데이터센터 뒤편에서 AI를 생산·유통하는 비용 구조와 단위를 근본적으로 재정의하는 게임 체인저다.

엔비디아 베라 루빈은 ' AI 팩토리 인프라'의 초대형 사이클의 시작이다.

👉 "칩을 넘어 빛과 물, 전기로"...AI 팩토리의 혈관을 장악한 7개 기업은?

황 CEO는 블랙웰+루빈의 주문 파이프라인이 2027년까지 1조 달러 이상이라고 밝혔다. GPU뿐 아니라 네트워크, 스토리지, 전력, 냉각, 건설까지 수직으로 동반 투자가 일어날 것이다. 클라우드 1차 붐(가상머신), 2차 붐(컨테이너), 3차 붐(에이전트형 AI 팩토리)의 인프라 사이클이 열린다.

컴퓨팅이 행성 규모로 확장되는 것은 젠슨 황 CEO 기조연설의 '서프라이즈'였다.

젠슨 황은 "컴퓨팅이 행성 규모(Planetary Scale)로 확장될 것이다. 베라 루빈 스페이스 모듈이 궤도 데이터센터를 향한 첫걸음이다"고 밝혔다. 현대기아 자율주행, 글로벌 로보틱스, 우주 컴퓨팅까지 에이전트와 물리 AI가 결합되는 세계가 온다.

베라 루빈은 그 희망을 물리적으로 구현하는 첫 번째 단계다. 그리고 그 공장을 짓는 데 필요한 메모리를 만드는 두 회사가 한국에 있다.

나는 현재 가능한 것과 엔비디아가 하는 일을 바탕으로 미래에 일어날 일들을 예측하며 큰 희망을 느낀다. 질병의 종식, 오염의 대폭 감소, 생물학적 기계와 인간의 마음을 이해하는 것이 이제는 합리적으로 기대할 수 있는 범위 내에 있다.
젠슨 황 엔비디아 CEO, GTC2026 이후 렉스 프리드먼과의 팟 캐스트 인터뷰에서
이 기사와 관련있는 기사 현재 기사와 관련된 기사들 입니다.
손재권  기자의 기사들