사람처럼 보고·듣고·이해… 구글 안내 로봇, 왜 혁신적인가

reporter-profile
박원익 2024.07.12 17:37 PDT
사람처럼 보고·듣고·이해… 구글 안내 로봇, 왜 혁신적인가
구글이 공개한 길 안내 로봇 (출처 : Google DeepMind)

구글 딥마인드, 사람처럼 상호작용하는 길 안내 로봇 공개
자연어, 이미지 등 멀티모달 명령 이해하는 ‘지능형 에이전트’
제미나이 1.5 프로 기반으로 작동… ‘모빌리티 VLA’ 제시
학습 시간 적고 적응력 뛰어나… “로봇 내비게이션 새로운 패러다임”

“로봇, 뭘 좀 그릴 수 있는 곳으로 안내해 줄래?”

“알겠어요. 제미나이(Gemini)로 생각 중입니다. 잠시 시간을 주세요. (몇 초 후) 저를 따라오세요.”

11일(현지시각) 구글 딥마인드가 공개한 로봇 시연 영상에 등장하는 장면이다. 집사처럼 노란색 나비넥타이를 단 이 로봇은 바퀴를 스르륵 움직여 건물 내부를 이리저리 이동하더니 벽 한쪽을 차지한 대형 화이트보드 앞에 멈춰 섰다. 

“축하합니다. 목적을 달성했어요. 화이트보드에 그림을 그릴 수 있습니다.”  

기존 안내 로봇과 구글이 공개한 로봇의 차이점은 뭘까? 얼핏 간단해 보이는 안내이지만, 작동 구조를 하나하나 뜯어보면 절대 그렇지 않다.  

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.