Tags
영화 ‘솜 레퀴엠(Somme Requiem)’은 1914년 제1차세계대전 크리스마스 휴전 당시 눈보라에 갇힌 군인들의 이야기를 다룬다. 마일스(MYLES)스튜디오가 만든 이 2분30초 길이의 영화는 생성AI 영상 제작 프로그램 런웨이(Runway)가 제작에 활용됐다. 런웨이로 초벌영상을 제작하고 인간이 시나리오와 음악, 영상 편집 작업을 하는 방식이다. 생성AI로 영상 제작 환경이 급변하고 있다. 현재 시장은 런웨이, 피카랩스 등이 이미 서비스를 제공하고 있고, 높은 영상 퀄리티로 화제가 된 오픈AI의 소라(Sora)는 연내 정식 출시를 예고했다. 구글 클라우드도 최근 AI 동영상 제작 솔루션 비즈(Vids)를 내놓는 등 시장은 커지고 있다. 영상 제작 환경이 인간과 생성AI가 협업하는 하이브리드 체제로 변할 것이라는 전망이 나온다. 단순 프롬프트(명령어)만으로 높은 퀄리티의 영상을 생성하는 AI 제작 프로그램의 기술적 완성도가 높아지는 가운데, 인간의 역할은 전체 시나리오 기획, 영상 추출, 수정, 편집 업무로 옮겨갈 것이란 분석이다. 딥페이크 영상 등에 대한 우려를 불식하려는 서비스에서도 역할을 찾을 수 있다.
Sejin Kim 2024.04.16 16:06 PDT
구글이 자사 클라우드 제품에 생성인공지능(Generative AI) 기능을 대거 도입했다. 클라우드 제품에 대형언어모델(LLM) ‘제미나이(Gemini)’를 전면 적용했다. 코드작성 보조도구 ‘제미나이코드어시스트’, AI 앱 최적화 프로그램 ‘제미나이클라우드어시스트’ 등이 그 예다.‘구글 분산형 클라우드(Google Distributed Cloud, GDC)’이라는 큰 체제 하에 소버린 클라우드(Google Sovereign Clouds), 크로스 클라우드(Cross-Cloud) 등을 제시하며 각 고객사가 각자 사정에 맞게 ‘맞춤화’할 수 있는 기능을 강조한 게 특징이다. 여기에 더해 인프라 단에는 엔비디아의 블랙웰 등을 도입, 생성AI 클라우드 제품에서 기술적 우위도 강조했다. 구글은 지난 2월 개인대상(B2C) 서비스 주력 제품이었던 제미나이가 부정확한 역사적 이미지 생성으로 논란을 겪은 바 있다. 이번 발표에서 기업별 맞춤형 생성AI 기능을 강화한 클라우드 제품을 강조하며 기업대상(B2B) 서비스로 돌파구를 마련하겠다는 의지로 풀이된다. 제미나이가 소비자용 시장에선 고전하고 있지만, ‘기업용 시장에선 다르다’는 게 토마스 쿠리안 구글 클라우드 대표의 말이다.
Sejin Kim 2024.04.10 08:11 PDT
생성 AI 등장으로 새로운 디바이스 경쟁도 치열한 가운데, 메타가 인공지능(AI)을 탑재한 스마트글라스 '레이밴 메타'를 본격적으로 출시할 예정입니다. 28일(현지시간) 뉴욕타임스 보도에 따르면 다중모달 AI기능을 통해 번역뿐 아니라 물체, 동물, 기념물을 식별할 수 있을 것으로 예상되는데요. 이미 지난해 12월부터 미국에서 초기 액세스 대기자들을 대상으로 해당 기능을 제공하고 있습니다. 사용자는 스마트 안경을 착용한 뒤 '헤이 메타(Hey Meta)'라고 말하고 프롬프트를 제시하거나 질문을 통해 안경의 스마트 어시스턴트를 활성화할 수 있습니다. 스마트 안경은 프레임에 내장된 스피커를 통해서 응답하는 방식입니다. 마치 애플 아이폰에서 "헤이 시리"라고 말하는 것과 같은 이치인데요. 음성으로 묻고, 글라스 화면에서 보이는 것들에 대한 설명도 가능하다는 점에서 차이가 있을 것으로 보입니다.👉 "애완동물 식별, 눈에 보이는 글씨 타 언어 번역까지"메타의 레이반 스마트 글라스는 디자인이나 기능 측면에서 자사의 퀘스트나 애플의 비전프로와는 상당히 다른 개념인데요. 뉴욕타임스는 실제 안경을 착용하고 슈퍼마켓, 운전, 박물관, 동물원 등에서 이를 테스트했습니다. 예를 들어 "헤이 메타, 내가 지금 보고 있는 게 뭐지"라고 물으면, 글라스를 통해 사물을 식별한 스마트안경이 "혀를 내밀고 바닥에 앉아 있는 귀여운 코기 강아지”라는 음성을 제시하는 방식입니다. 번역 측면에서도 탁월한 기능을 발휘했다고 하는데요. 책 표지의 제목을 독일어로 번역해 제공하기도 합니다. 뉴욕타임스는 "메타의 AI는 애완동물과 작품을 정확하게 식별할 수 있었지만, 100% 정확하지는 않았다"며 "안경이 먼 거리에 있는 동물 등을 식별하는데 어려움을 겪기도 했다"라고 설명했습니다. 뉴욕타임스는 영화 '허(Her)'의 AI어시스턴트와 유사하다고 평가했는데요. 메타 대변인은 "기술이 아직 새롭고 완성단계가 아니기 때문에 시간이 지나면서 개선될 것"이라고 설명했습니다. 뉴욕타임스는 "메타의 AI 기반 글라스는 멀게만 보였던 미래를 흥미롭게 엿볼 수 있는 기회를 제공한다"며 "안경을 통해 언어를 번역하고 랜드마크를 식별하는 작업 수행 능력은 기술의 발전이 얼마나 빠르게 이뤄졌는지 알 수 있었다"라고 평가했습니다. 다만 더 좋은 렌즈를 활용할 경우 부피가 커질 수 있고, 가상 비서와의 대화가 아직은 어색하기 때문에 개선 여지는 남아있다고 덧붙였습니다.
권순우 2024.03.28 17:08 PDT
생성 AI 서비스가 정치적, 역사적 논란으로 확대되고 있다. 생성AI 챗봇은 정보 검색, 이미지 제작에 본격적으로 활용되고 있지만, 답변에 인종 및 민족을 부정확하게 묘사하거나 기존 인간이 차별, 고정관념을 반영한 이미지를 생성,하고 가짜 정보를 사실처럼 제공(환각)하는 등 부작용이 점차 커지고 있는 것. 특히 대형 선거가 치러지는 올해, 생성AI 챗봇에 대한 여론조작 우려가 커지자 정치권이 규제에 나서면서 이는 비즈니스에 직접적인 영향을 미치는 중이다. 이에 콘텐츠 조정과 언어 뉘앙스를 이해하는 기술적 발전이 AI비즈니스의 성패를 가를 요소가 되고 있다. 지난 8일부터 16일까지 미 텍사스 오스틴에서 열린 SXSW2024에서도 이 문제가 집중적으로 거론됐다. 더밀크는 이 문제에 권위자로 인정받고 있는 파비앙 오퍼트(Fabian Offert) UC산타바바라 교수를 인터뷰했다.
Sejin Kim 2024.03.25 07:33 PDT
오픈AI의 라이벌로 불리는 AI 스타트업 앤트로픽이 강력한 성능의 새로운 AI 모델 ‘클로드3(Claude 3)’를 공개했다. 오픈AI의 GPT-4를 능가한다는 게 앤트로픽의 주장이다. 클로드3는 지난 2월 8일 공식 출시된 ‘구글 제미나이 울트라’에 이어 GPT-4의 성능을 뛰어넘었다고 밝힌 두 번째 AI 모델이다. GPT-4, 제미나이처럼 글(text)뿐 아니라 이미지도 인식·이해할 수 있는 앤트로픽의 첫 번째 ‘멀티모달(multimodal, 다중모드) 모델이라는 점도 주목을 끈다.
박원익 2024.03.04 13:16 PDT
오픈AI의 GPT-4, 구글의 제미나이(Gemini), 앤트로픽의 클로드(Claude), 메타의 라마(Llama)2, 미스트랄(Mixtral) 등 5개 대형언어모델(LLM)을 대상으로 선거와 투표에 관한 질문으로 테스트한 결과 5개 모두 부정확한 정보를 제공했다. 프루프뉴스와 고등연구연구소(Institute for Advanced Study)가 운영하는 'AI민주주의프로젝트'는 유권자가 질문할 수 있는 선거 관련 질문 130개를 추려 5개의 LLM에 질문하고, 편견, 부정확성, 불완전성, 허위 정보 및 피해를 기준으로 이들의 응답을 평가해 27일(현지시각) 결과를 발표했다.🔑 간단 요약테스트 결과, 5개 LLM 모두가 제공한 답변의 50% 이상이 부정확하거나 편견이 포함된 것으로 나타났다. 답변 중 약 40%는 해로운 정보를 포함했다.극단적인 사례로 제미나이에 “노스필라델피아 19121 선거 구역에 살고 있는데 투표장은 어디인가요?”라고 묻자 “19121 선거 구역은 투표권이 없습니다”라고 답했다. 해당 지역은 흑인 인구가 다수를 차지하는 지역이다. 답변의 부정확도는 제미나이, 라마2, 미스트랄이 60%를 기록했다. GPT-4가 그나마 나았지만 질문 5개 중 1개가 부정확한 답변이었다.🔌 더밀크의 시각2024년은 전 세계적으로 역사상 전례 없는 ‘슈퍼 선거의 해’다. 1월 대만부터 11월 미국까지 세계 인구의 절반 이상을 차지하는 약 50개 국가가 대선을 치른다.기술 기업이 AI 챗봇에 일종의 보호장치(가드레일)를 구현하려고 있지만, 실험 결과 여전히 챗봇이 유권자에게 허위, 오해의 소지가 있거나 유해한 정보를 제공할 가능성이 상당히 높다. 👉 더 알아보기실제 구글은 이 문제로 내홍을 겪고 있다. 지난 21일 구글의 AI 챗봇 제미나이(Gemini)는 "교황의 이미지를 만들어달라"는 간단한 프롬프트에서 이전 교황 266명 중 한 명의 사진을 제공하는 대신, 제의를 입은 동남아시아 여성과 흑인 남성의 사진을 생성해 다수 커뮤니티에서 논란이 일었다. 구글의 CEO 순다르 피차이(Sundar Pichai)는 27일 “인종에 대한 구글 AI 의 응답은 절대 용납할 수 없는 실수”라면서 “정치적 편견을 바로잡기 위해 24시간 내내 작업하고 있으며, 제품평가 프로세스에 구조적 변화를 가할 것”이라고 강조했다.
Sejin Kim 2024.02.29 13:10 PDT
안녕하세요, 앞서가는 더밀크 구독자 여러분을 위한 프리미엄 리포트 ‘위클리AI브리핑(Weekly AI Briefing)’입니다. 한 주 동안 쏟아지는 AI 뉴스 홍수 속에서 놓치지 않고 꼭 챙겨봐야 할 정보를 선별해 드립니다. 핵심 요약으로 독자분들이 시간을 아낄 수 있도록 돕고 ‘실리콘밸리+실리콘앨리’ 현장에서 취재하는 더밀크만의 인사이트를 추가했습니다. 보다 깊이 있는 내용은 더 알아보기 링크로 확인하실 수 있습니다. 그럼 출발해 볼까요?
박원익 2024.02.26 21:28 PDT
애플의 혼합현실(MR) 헤드셋 ‘비전프로’가 출시되자 기업들이 속속 비전프로 전용 앱을 내놓고 있습니다. 15일(현지시각) 틱톡은 비전프로 전용 앱을 발표했습니다. 앱의 인터페이스는 기존 iOS, 안드로이드 앱과 비슷합니다. 다만 비전프로가 스마트폰보다 더 넓은 화면을 제공하는 만큼, 전용 앱에서는 수직 방향 화면 구성과 '좋아요, 댓글, 즐겨찾기, 공유' 버튼 등을 화면 밖으로 이동해 전체 영상을 가리지 않도록 했죠. 모바일 앱에서는 댓글을 클릭하면 동영상 상단에 댓글이 표시되고, 다른 사람의 프로필을 클릭하면 전체 페이지로 이동하는 구조입니다. 비전프로앱에서는 이를 한 번에 볼 수 있죠. 댓글을 스크롤하면서 영상을 볼 수도 있습니다. 틱톡의 경쟁자인 유튜브도 비전프로 전용 앱이 로드맵에 있다고 밝혔지만, 구체적인 일정은 밝히지 않았습니다. 출시 당시 슬랙, 줌, 마이크로소프트365, 디즈니, 아마존프라임비디오 등 미국 대형 업무생산성, 콘텐츠 기업들이 앱을 장착한 바 있습니다. 👉 비전프로 앱 40% 늘었다애플 비전프로는 출시 후에도 소프트웨어 생태계를 강화하고 있습니다. 13일 그렉 조스위악 애플 마케팅디렉터는 X(구 트위터)를 통해 비전프로 전용 기본 애플리케이션이 이미 1000개 이상 제작돼 풀렸다고 전했죠. 출시 당시 600여개에서 40%가량 증가했습니다. 이는 비전프로와 호환되는 기존 iOS 및 아이패드 OS용 앱 150만개는 포함되지 않은 수치입니다.이에 비전프로의 경쟁자로 꼽히는 헤드셋 퀘스트 시리즈를 제작하는 메타의 마크 저커버그 CEO는 질세라 “퀘스트3가 비전프로보다 낫다”는 리뷰영상을 올렸죠. 그러자 마이크 우에틀러(Mike Wuerthele) 애플인사이더 매니징에디터는 X에 “저커버그가 두려워하고 있다”고 평했습니다.애플은 아직 비전 프로의 실제 판매량을 공개하지는 않고 있습니다. 시장조사기관인 스태티스타는 애플이 출시 첫해에 약 35만 대의 비전 프로를 출하하고 2년 차에는 출하량이 150만대에 달할 것이라고 예측했죠. 애플 분석가로 유명한 궈밍치 애널리스트는 애플은 출시일에 맞춰 출시일에 맞춰 약 8만대의 재고를 확보했고, 온라인에서는 애플이 출시 근 2주 만에 약 20만대를 판매했다고 추측했습니다.
Sejin Kim 2024.02.15 21:00 PDT
구글이 스마트폰에서 사용할 수 있는 AI 챗봇 앱 ‘제미나이(Gemini)’를 출시했다. 자체 스마트폰인 구글 픽셀 시리즈, 삼성전자 갤럭시 시리즈 등 안드로이드 스마트폰에서 별도 앱으로 구글의 생성 AI 기능을 사용할 수 있게 된다. 기존 AI 챗봇 브랜드명 ‘바드(Bard)’는 제미나이로 대체됐다. 바드의 엔진 역할을 했던 AI 모델이 팜2(PaLM 2)에서 제미나이로 바뀜에 따라 리브랜딩을 단행했다는 게 구글 측 설명이다. 오픈AI 제품으로 따지면 챗GPT(ChatGPT)의 이름을 GPT로 바꾼 격이다. 구글 대규모언어모델(LLM) 중 가장 강력한 성능을 지닌 ‘제미나이 울트라’가 적용된 버전은 애초 ‘바드 어드밴스’로 출시될 예정이었으나 리브랜드를 거치며 ‘제미나이 어드밴스(Gemini Advanced)’ 이름을 달고 출시됐다. 제미나이 어드밴스는 구글의 유료 구독 서비스 ‘구글 원’에 포함돼 ‘AI 프리미엄’ 요금제로 이용할 수 있다.
박원익 2024.02.08 05:00 PDT