자유롭게 목소리 만드는 시대.. 'AI 음성의 미래' 일레븐랩스
2024년 6월, 대만 타이페이에서 열린 컴퓨텍스에서 젠슨 황 엔비디아 CEO가 기조연설에 나섰다. 곧이어 놀라운 일이 벌어졌다. 영어로 시작된 연설이 유창한 중국어로 바뀌었고 6500여명의 관객들은 환호했다. 영상 속에서 젠슨 황 CEO는 중국어를 능숙하게 구사했다(그는 과거에 중국어에 서툴다고 고백한 바 있다.). 젠슨 황 CEO가 갑자기 중국어에 능통해진 걸까? 아니면 그의 목소리를 빼닮은 통역사가 있는걸까? 젠슨 황 CEO는 "영상에서 중국어를 유창하게 한 사람은 내가 아니고 '젠슨AI'"라고 설명했다. 젠슨 황 CEO의 중국어 연설은 폴란드 출신의 두 젊은 창업가가 만든 AI의 작품이었다. 일레븐랩스(ElevenLabs)라는 스타트업은 단 7분의 음성 샘플로 젠슨 황의 목소리를 완벽하게 복제했고 이를 중국어로 변환하는 데 성공했다. 일레븐랩스는 생성AI를 이용해 고품질의 맞춤형 음성 합성 솔루션을 제공한다. 이들의 사명은 모든 음성 언어로 사람들이 콘텐츠를 보편적으로 이용할 수 있도록 만드는 것이다. 일레븐랩스는 영화와 TV 프로그램부터 팟캐스트, 오디오북, 실시간 대화에 이르기까지 다양한 오디오 콘텐츠를 원어민의 음성 특성을 유지하며 모든 언어로 자유롭게 변환할 수 있길 꿈꾼다. 폴란드의 작은 도시에서 시작된 이 스타트업은 어떻게 2년 만에 실리콘 밸리의 거인들과 어깨를 나란히 하게 됐을까?