레노버, "클라우드 시대 끝나고 추론, 엣지 AI 시대 열린다"
레노버, AI 권력 해체 선언…"'하이브리드 AI'로 AI의 민주화 이룰 것"
AI 추론 시대 개막: 엣지 컴퓨팅과 다중 에이전트 협업의 부상
PC·폰·웨어러블이 하나로…‘키라’가 보여준 에이전틱 AI의 미래
원-사이즈 전략은 끝났다…레노버, 맞춤형 AI 인프라로 시장 공략 선언
레노버, AI 권력 해체 선언…"'하이브리드 AI'로 AI의 민주화 이룰 것"
레노버가 AI 시대의 새로운 패러다임으로 '하이브리드 AI' 전략을 제시하며, 개인용 AI 슈퍼 에이전트 '레노버 키라(Lenovo Kira)'를 전격 공개했다. 레노버는 AI의 힘을 소수의 기술 기업이 아닌 모든 개인과 기업에게 돌려주겠다는 'AI 민주화'를 선언했다는 평이다.
6일(현지시각) 라스베가스 스피어에서 열린 'CES 2026 레노버 테크 월드'에서 레노버는 클라우드, 온프레미스, 엣지 컴퓨팅을 아우르는 하이브리드 AI 생태계 구축 계획을 밝혔다.
이는 AI 컴퓨팅을 중앙 집중식 클라우드에만 의존하지 않고 데이터가 생성되는 모든 지점, 즉 기기가 스스로 생각하는 온디바이스 AI로 확장하겠다는 전략이다.
레노버가 공개한 'AI 기가 팩토리'와 개인 AI 에이전트인 '키라'는 단순한 신제품 발표로 보이지만 산업의 진화 측면에서 보면 AI 컴퓨팅 인프라가 클라우드에서 엣지 기기로 이동하는 산업 구조의 재편 가능성을 시사한다.
레노버의 양 위안칭 CEO는 "AI 워크로드의 무게중심이 '학습'에서 '추론'으로 이동하고 있다"며 중앙 집중식 클라우드 인프라만으로는 실시간성, 비용, 그리고 규제 요구를 충족할 수 없다고 강조했다.
그는 이를 해결하기 위해 '하이브리드 AI' 전략을 제시하며 퍼블릭 클라우드부터 온프레미스 데이터센터를 포함해 공장이나 병원 같은 로컬에서 구동되어야 하는 엣지 환경, 그리고 개인의 스마트폰까지 컴퓨팅을 분산시켜야 한다고 주장했다.
AI 추론 시대 개막: 엣지 컴퓨팅과 다중 에이전트 협업의 부상
레노버 CTO 톨가 쿠르토글루 박사는 "지난 수년간 AI 모델 크기가 매년 10배씩 증가했다"며 "1000억 개에서 1조 개, 그리고 10조 개로 커지면서 학습된 모델을 실제 상황에 적용하는 추론 단계의 컴퓨팅 수요가 폭발적으로 늘고 있다"고 설명했다.
문제는 추론이 학습과 달리 실시간성, 엣지 컴퓨팅을 요구한다는 점이다.
공장 라인에서 불량품을 감지하거나, 금융 거래에서 사기를 차단하거나, 의료 영상을 분석하는 작업은 데이터를 클라우드로 보내 응답을 기다릴 여유가 없다. 게다가 민감한 의료·금융 데이터를 외부 클라우드로 전송하는 것은 일부 규제 환경에서 컴플라이언스 리스크를 높이는 요인이다.
그는 "AI의 미래는 단일 모델이 아닌 모델의 우주"라며 "주머니 속 스마트폰의 소형 모델부터 데이터센터의 대규모 언어모델(LLM)까지, 작업에 가장 적합한 모델을 지능적으로 선택하고 연결하는 것이 핵심"이라고 강조했다.
이러한 하이브리드 접근은 실시간 응답 속도 확보, 민감 데이터의 보안 강화, 불필요한 클라우드 전송 비용 절감이라는 세 가지 실질적 가치를 동시에 제공한다.
레노버는 이를 해결하기 위해 세 개의 기술 레이어를 제시했다.
지능형 모델 오케스트레이션(Intelligent Model Orchestration)은 간단한 작업은 디바이스 내 소형 모델로, 복잡한 작업은 클라우드 대형 모델로 라우팅해 지연시간과 비용을 최적화한다.
에이전트 코어(Agent Core)는 사용자 의도를 파악하고 과거 상호작용을 기억하는 인지 엔진이다.
다중 에이전트 협업(Multi-agent Collaboration)은 복잡한 목표를 여러 전문 에이전트가 협업해 해결하는 구조다.
이것이 무엇을 의미하는가. AI 컴퓨팅이 클라우드 제공업체의 중앙 집중식 구조에서 벗어나 데이터 생성 지점인 엣지 환경으로 분산되는 진화가 일어나고 있음을 시사한다.
PC·웨어러블·엣지까지…레노버, AI 패권 위해 칩 빅4 동시 공략
또 한가지 주목할만한 점은 레노버가 엔비디아, AMD, 인텔, 그리고 퀄컴 등 주요 반도체 기업 전체와 동시다발적 협력을 발표했다는 사실이다.
이는 AI 인프라 시장이 다각화되고 있다는 신호로도 읽힌다.
레노버의 다중 협력은 단순한 제품 포트폴리오의 확장으로 보기 어렵다. 오히려 특정 칩 공급업체에 대한 의존도를 낮추고 각 워크로드에 최적화된 선택지를 확보하려는 공급망 리스크 전략에 가깝다.
실제 레노버가 이날 발표한 협력 구조는 AI 칩 시장이 권력 분산을 할 것임을 전제로 설계된 것처럼 보인다.
엔비디아와는 'AI 기가 팩토리'를 공동 출시했다.
레노버가 세계 슈퍼컴퓨터 500대 중 3분의 1을 구축한 제조 역량과 넵튠 액체 냉각 기술을 엔비디아의 차세대 루빈 플랫폼과 결합했다. 엔비디아의 젠슨 황은 "고객들은 시스템을 최대한 빨리 첫 토큰에 도달시키고 활용하기를 원한다"며 복잡한 AI 인프라의 신속한 제품화를 강조했다.
AMD와는 EPYC 프로세서 탑재 AI 추론 서버 '씽크 시스템 SR675i'를 출시하고, AMD의 '헬리오스 랙스케일 AI 아키텍처'를 조기 도입했다. AMD CEO인 리사 수 박사는 "AI 추론의 붐이 올 것"이라며 "엣지에서의 추론은 공장에서 실시간 유지보수 경고를, 체인점에서 재고 부족 즉각 알림을 제공해 경쟁 우위를 준다"고 말했다. 엣지 컴퓨팅을 위해 AMD의 차세대 인스팅트 가속기 MI455X는 대규모 처리량과 업계 최고 수준 고대역폭 메모리를 갖췄다.
인텔과는 30년 파트너십을 기반으로 'AI PC 아우라 에디션' 포트폴리오를 공동 개발했다. 레노버의 개인 AI 에이전트 '키라'는 향후 모든 아우라 에디션 PC에 기본 탑재될 예정이다.
퀄컴과는 스마트 글래스·AI 펜던트 등 지능형 웨어러블에서 협력한다. 퀄컴 CEO 크리스티아노 아몬은 "웨어러블은 수십억 개 파라미터 모델을 로컬에서 실행할 수 있어야 한다"며 웨어러블 기기가 곧 휴대폰과 어깨를 나란히 하는 새로운 모바일 기기 카테고리로 "수억 대 규모로 성장할 잠재력이 있다"고 전망했다.
레노버의 공급망 다각화 전략은 각각의 워크로드에 최적화된 공급자를 구축해 '하이브리드 AI' 생태계를 장악하겠다는 야심을 그대로 드러낸다. AMD는 개방형 생태계를, 인텔은 PC 생태계를, 퀄컴은 엣지와 모바일 분야의 강자로 레노버는 이들을 통합해 AI 디바이스 왕국을 건설한다.
PC·폰·웨어러블이 하나로…‘키라’가 보여준 에이전틱 AI의 미래
AI 기술이 '챗봇'에서 '에이전틱 AI'로 진화하면서 레노버가 발표한 '키라'도 큰 관심을 받았다. 레노버가 중국에서 먼저 출시한 개인 AI 에이전트 '키라'는 스마트폰·PC·태블릿·웨어러블 등 다양한 기기와 윈도우, 안드로이드 등 여러 운영체제에서 작동한다.
무대 시연에서 키라는 수 시간 동안 확인하지 못한 메시지 중 중요 내용만 추출 브리핑하고, 사용자 일정을 파악해 조카 선물 구매 시간을 캘린더에 자동 등록했다. PC에서 작성 중이던 FIFA 파트너십 문서를 찾아 최신 통계로 업데이트한 뒤 이메일 발송까지 수행했다.
특히 목걸이형 AI 웨어러블이 기록한 중요 순간, 스마트 글래스로 본 장면, 스마트폰 사진을 종합해 링크드인 게시물 초안을 자동 생성하는 장면은 다중 기기의 협업 가능성을 구체적으로 보여준 사례로 꼽혔다.
이는 현재 분산되어 있는 디지털 데이터와 개인의 경험이 하나의 흐름으로 통합되는 것의 경제적 가치를 보여주는 것으로 평가된다. 현재 대부분의 사용자는 업무용 PC와 개인용 스마트폰, 그리고 피트니스 웨어러블 등 여러 기기를 사용하지만 이들 사이의 데이터는 단절돼어 있다. 키라는 이 단절을 해소해 개인의 생산성을 높이고 기기 전환 비용 자체를 낮춘다.
레노버 지능형 기기 그룹 루카 로시 사장은 "3년 이내 AI PC가 시장의 80%를 차지하고, AI 스마트폰 수가 10억 대에 도달할 것"이라며 "키라가 10억 대 이상 기기에서 실행될 것"으로 전망했다.
다만 레노버의 이 비전에는 명확한 도전 과제가 있다.
첫째, 애플과 안드로이드 기기 간의 폐쇄성을 어떻게 통합하느냐 여부다. 애플은 완전히 폐쇄된 생태계 안에서 아이폰과 아이패드 등 기기 간 완벽한 통합을 제공하고 안드로이드 역시 크롬 등과의 크로스 플랫폼 경험을 제공한다. 레노버가 이들이 보유하고 있는 이질적 기술 스택을 통합하기는 쉽지 않다.
둘째, 프라이버시 우려다. 사용자의 모든 기기에서 데이터를 수집하는 AI 에이전트는 필연적으로 데이터 보안의 우려와 규제 가능성에 있다. 중국 기업인 레노버가 이를 보장하지 못하면 기술적 우수성과는 별개로 시장과 규제 당국이 기술 자체를 제한할 수 있다.
원-사이즈 전략은 끝났다…레노버, 맞춤형 AI 인프라로 시장 공략 선언
레노버는 '하이브리드 AI'를 구축하기 위해 AI 추론에 최적화된 서버 3종을 발표했다.
씽크 시스템 SR675i(별칭 더 비스트)는 넵튠 액체 냉각 기술과 높은 GPU 밀도로 대규모 LLM을 실행하며, 높은 토큰 처리량과 낮은 지연시간을 제공한다. 의료 분야에서 30GB MRI 이미지를 데이터 생성 위치에서 즉시 분석해 진단을 지원한다.
SR650i(스윗 스팟)는 대부분 추론 워크로드에 적합한 범용 서버로, 이미 5개 AI 추론 세계 기록을 보유한다. 금융 서비스에서 모든 거래를 실시간 분석해 사기를 탐지한다.
SE455i(애니웨어 서버)는 공장이나 매장 같은 엣지 환경에 최적화됐다. 소매업에서 라이브 비디오를 분석해 재고 예측 및 보충을 자동화한다.
레노버가 운영 환경과 요구 사항, 그리고 워크 로드에 최적화된 맞춤형 서버를 각각 소개한 것은 AI 시장이 '범용'에서 클라이언트가 요구하는 '맞춤형'으로 진화하고 있음을 의미하는 사례다.
이 포트폴리오의 전략적 의미는 '원-사이즈(one-size-fits-all)' 전략이 엔터프라이즈 AI 시장에서 점점 설 자리를 잃고 있음을 시사한다. 의료 영상 분석은 대용량 데이터 처리와 낮은 지연시간을, 금융 사기 탐지는 높은 처리량을, 소매 재고 관리는 엣지 환경의 내구성을 요구한다.
레노버는 AI 생태계가 클라우드에서 엣지 환경으로 전환되고 있다는 점도 강조했다.
레노버는 FIFA 월드컵 2026의 글로벌 기술 파트너로서 '풋볼 AI Pro'를 공동 개발했다. FIFA는 수 페타바이트(5000억 페이지 텍스트 분량) 경기 데이터를 보유하며, 이를 분석해 48개 참가팀에 전술 분석을 제공한다. AI 기반 심판 뷰와 3D 선수 아바타도 도입했다.
CES 발표 장소였던 라스베거스 스피어와의 협력도 주목할 만하다. 스피어의 18K '빅 스카이' 카메라 시스템은 초당 30GB 원본 데이터를 생성하는데, 레노버 워크스테이션과 인프라가 이를 실시간 처리한다.
이 사례들의 공통점은 데이터 처리가 생성 지점 근처에서 일어난다는 점, 즉 엣지 환경에서 구동된다는 것이다. FIFA 경기 데이터는 경기장에서, 스피어 영상 데이터는 공연장에서 즉시 처리돼야 한다. 클라우드로 데이터를 보내면 네트워크 지연과 대역폭 비용이 발생하고, 실시간 경험이 불가능해진다.
이는 레노버의 하이브리드 전략이 이론이 아니라 실제 시장 요구에 기반하고 있음을 보여준실제 사례라 할 수 있다. 데이터 생성 지점이 곧 컴퓨팅 지점이 되는 구조 전환은, 클라우드 제공업체 중심의 자본 집중 구조에서 엣지 인프라 제공업체로 자본이 재분배될 것임을 시사한다.
더밀크의 시각: AI 인프라의 중심 이동: 클라우드에서 엣지로
레노버의 발표는 '하이브리드 AI'를 표방하지만 사실상 시장의 관심과 실제 수요가 클라우드의 중앙 집중식에서 엣지 환경의 온디바이스 AI로 전환이 되고 있음을 보여주는 강력한 증거라 할 수 있다.
이는 중장비 업체인 캐터필러가 CES2026의 중앙 무대를 차지하며 AI의 미래가 엣지 환경에 있음을 강조한 것과 무관하지 않다.
지난 10년간 클라우드 컴퓨팅은 중앙 집중식 구조로 진화했다. AWS, 애저, 구글 클라우드와 같은 초대형 데이터센터가 전 세계 대부분의 워크로드를 처리했다. 이 구조는 규모의 경제를 통해 단위 컴퓨팅 비용을 낮췄지만 동시에 소수 기업으로의 권력 집중을 낳았다.
AI의 등장은 이 집중을 가속화했다.
GPT와 같은 대형 모델을 학습시키려면 수천 개의 GPU가 필요하고 이는 막대한 자본의 지출을 요구한다. 빅테크가 아니면 감당할 수 없는 규모다. 자연스럽게 AI 산업은 자본 집중식 모델의 표본이 됐고 그렇게 빅테크가 AI 인프라를 장악할 것이란 전망이다.
하지만 추론 단계에서 우리는 균열을 목격하고 있다.
추론은 학습과 달리 실시간성을 요구하고 민감한 데이터는 외부로 보낼 수 없다. 인터넷 통신을 통해 데이터를 주고 받으며 발생하는 대역폭 비용이 누적되면 기업의 경제성도 악화된다.
레노버의 '하이브리드 AI'는 바로 이 균열을 공략한 전략이지만 결국 AI 인프라가 엣지 AI로 진화하고 있는 것이 시장의 요구임을 증명한다. 이것이 무엇을 의미하는가?
클라우드 중심 구조에서는 엔비디아의 최고급 칩이 핵심이다. 하지만 엣지 추론은 저전력-고효율의 칩을 요구하고 다양한 워크로드에 맞춘 최적화를 필요로 한다. 레노버가 AMD, 인텔, 퀄컴 등 각자 영역에서 경쟁력을 갖는 기업들과 협업한 이유다.