GPT-4o도 제쳤다… 앤트로픽, 클로드 3.5 소네트 출시 ‘경쟁 가열’

박원익 2024.06.20 10:52 PDT

공유하기 선물하기

이 기사를 지금 공유해보세요.

이 기사에 관심이 있을 만한 사람들과 공유하고 더밀크를 추천해주세요.

Facebook

Twitter

Kakaotalk

LinkedIn

GPT-4o도 제쳤다… 앤트로픽, 클로드 3.5 소네트 출시 ‘경쟁 가열’

(출처 : shutterstock)

오픈AI 최신 모델 GPT-4o 벤치마크 점수 능가
전 세대 대비 속도 2배 빠르고 저렴… 코딩 능력 탁월
첨단 시각 능력 갖춘 멀티모달 모델… “외부 안전성 평가 완료”

오픈AI의 대항마 앤트로픽(Anthropic)이 강력한 성능을 가진 새로운 AI 모델 ‘클로드 3.5 소네트(Claude 3.5 Sonnet)’를 공개했다. 벤치마크(성능 평가) 점수에서 오픈AI가 지난 5월에 공개한 최신 모델 GPT-4o를 능가했다는 게 앤트로픽 측 설명이다.

인간을 능가하는 AGI(범용인공지능), 초지능(Superintelligence)을 향한 생성 AI 모델 경쟁이 더욱 치열해질 전망이다. 현재 오픈AI는 차세대 모델 GPT-5를 개발 중이다. 오픈AI 공동창업자이자 수석과학자 출신인 일리야 수츠케버는 전날 새로운 AI 스타트업 ‘세이프 슈퍼인텔리전스(SSI)’를 설립했다고 밝혔다.

앤트로픽은 20일(현지시각) 회사 블로그를 통해 클로드 3.5 모델 제품군 중 첫 번째로 소네트를 출시한다고 발표했다. 소네트는 앤트로픽의 제품군 중 중간급 모델이다. 앤트로픽은 가장 강력한 모델인 클로드 3.5 오푸스(Opus), 경량화 모델 클로드 3.5 하이쿠(Haiku)도 순차적으로 출시할 예정이다.

앤트로픽이 공개한 벤치마크 점수표 (출처 : Anthropic)

전 세대 대비 속도 2배 빠르고 저렴… 코딩 능력 탁월

앤트로픽에 따르면 클로드 3.5 소네트는 대학원 수준의 추론 능력(GPQA), 학부 수준의 지식(MMLU), 코딩 능력(HumanEval) 벤치마크 점수에서 업계 기존 기록을 갈아치웠다.

클로드 3.5 소네트의 GPQA는 59.4%로 GPT-4o의 53.6%를 크게 앞섰고, 코딩 능력 역시 92.0%를 기록, 90.2%의 GPT-4o 대비 1.8%포인트 높았다. 앤트로픽의 전 세대 모델 중 최고 성능을 자랑했던 클로드 3 오푸스의 성능 역시 모두 앞질렀다.

앤트로픽은 “뉘앙스, 유머, 복잡한 지침을 파악하는 능력이 현저히 향상됐다. 자연스럽고 공감할 수 있는 어조로 고품질 콘텐츠를 작성하는 데 탁월하다”고 했다.

특히 코딩 능력이 뛰어나 정교한 추론 및 문제 해결 기능을 통해 독립적으로 코드를 작성, 편집 및 실행할 수 있다. 코딩 AI 에이전트(agent, 대리인) 수준으로 활용할 수 있는 셈이다. 앤트로픽 측은 “코드 번역을 쉽게 처리할 수 있어 기존 애플리케이션 업데이트, 코드베이스 마이그레이션에 특히 효과적”이라고 했다.

작동 속도, 비용 효율성 역시 개선됐다. 전 세대 최고 모델인 클로드 3 오푸스 대비 2배 속도로 작동하며 비용은 클로드 3 오푸스보다 저렴해졌다는 설명이다.

클로드 3.5 소네트 성능 및 비용 비교표 (출처 : Anthropic)

첨단 시각 능력 갖춘 멀티모달 모델… “외부 안전성 평가 완료”

클로드 3.5 소네트는 이미지 인식 능력을 갖춘 멀티모달 모델이다. 이미지 인식 능력을 평가하는 표준 비전(vision) 벤치마크에서도 전 세대 모델 클로드 3 오푸스를 능가했다.

앤트로픽은 “불완전한 이미지에서 텍스트를 정확하게 전사(transcription)할 수 있다”며 “텍스트보다 이미지, 그래픽, 일러스트레이션에서 더 많은 정보를 얻을 수 있는 소매, 물류, 금융 서비스의 핵심 기능”이라고 했다.

클로드가 생성한 창작물을 사용자가 실시간으로 보면서 편집, 구축할 수 있는 ‘아티팩트(Artifacts on)’ 기능도 추가했다. 웹(claude.ai)에서 클로드가 생성한 콘텐츠를 프로젝트, 작업 절차에 원활하게 통합할 수 있는 일종의 작업 공간이다.

안전성도 강조했다. 영국 인공 지능 안전 연구소(UK AISI)에 배포 전 안전성 평가를 위해 클로드 3.5 소네트를 제공하는 등 외부 전문가들과 협력하고 있다는 것이다. 앤트로픽은 “UK AISI는 3.5 소네트의 테스트를 완료, 미국과 영국 AISI 간의 파트너십에 따라 그 결과를 미국 인공지능 안전 연구소(US AISI)와 공유했다”며 “개인정보 보호 역시 내부 핵심 원칙 중 하나다. 사용자가 명시적으로 허용하지 않는 한 사용자가 제출한 데이터로 모델을 학습하지 않는다”고 했다.

앤트로픽 설립자 다리오 아모데이는 누구?

다리오 아모데이는 컴퓨터 공학, 인공 신경망 등 AI 관련 학문을 전문적으로 연구한 전공자가 아니다. 칼텍과 스탠퍼드대에서 물리학을, 프린스턴대학에서 생물물리학을 연구한 물리학도 출신이다.

그런 아모데이가 AI에 본격적으로 관심을 가지기 시작한 건 2012년 이후였다. 당시 제프리 힌튼 토론토대 교수, 일리야 수츠케버가 함께 개발한 이미지 인식 시스템 ‘알렉스넷(AlexNet)’를 통해 AI를 접하며 AI가 인간의 뇌처럼 작동한다는 점에 큰 흥미를 느낀 것이다.

아모데이는 2014년 11월 중국 기술기업 바이두(Baidu)에 합류, 구글 브레인의 공동 창립자이자 최고 과학자를 지낸 앤드류 응(Andrew Ng) 스탠퍼드대 교수가 포함된 AI 과학자 및 시스템 엔지니어 팀에서 일했다. 이후 2015년 구글로 자리를 옮겼다가 2016년 오픈AI에 합류, 연구 부사장(Vice President of Research)까지 지낸 후 2021년 오픈AI에서 함께 일하던 여동생 다니엘라 아모데이와 앤트로픽을 설립했다.

파이낸셜 타임즈에 따르면 다리오 아모데이는 2019년 오픈AI가 마이크로소프트로부터 10억달러의 투자를 받은 이후 오픈AI의 방향성에 우려를 느껴 회사를 떠난 것으로 전해진다. 앤트로픽은 AI 모델의 오작동을 줄이는 ‘컨스티튜셔널 AI(Constitutional AI)’을 개발, AI 모델의 안전을 중요한 가치로 앞세우고 있다.

앤트로픽의 CEO와 사장을 맡고 있는 다리오와 다니엘라 아모데이 남매 (출처 : 앤트로픽)

더밀크 회원으로 가입하시면 실리콘밸리에서 나오는 혁신 비즈니스 트렌드와 자본의 흐름을 가장 먼저 파악하고 앞서갈 수 있습니다. 주 4회 뷰스레터를 무료로 제공합니다. 유료 회원으로 업그레이드하시면 더밀크 콘텐츠를 제한없이 보고 더밀크의 스페셜 리포트를 받아보고 이벤트에 참석하실 수 있습니다.

더밀크 회원 가입하기

GPT-4o도 제쳤다… 앤트로픽, 클로드 3.5 소네트 출시 ‘경쟁 가열’

오픈AI 최신 모델 GPT-4o 벤치마크 점수 능가
전 세대 대비 속도 2배 빠르고 저렴… 코딩 능력 탁월
첨단 시각 능력 갖춘 멀티모달 모델… “외부 안전성 평가 완료”

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

[GTC 특집] 엔비디아, 왕조시대를 선언하다

잠 못 드는 당신, 계절 때문입니다

AI 인피니티 5

GPT-4o도 제쳤다… 앤트로픽, 클로드 3.5 소네트 출시 ‘경쟁 가열’

이 기사를 지금 공유해보세요.

오픈AI 최신 모델 GPT-4o 벤치마크 점수 능가 전 세대 대비 속도 2배 빠르고 저렴… 코딩 능력 탁월 첨단 시각 능력 갖춘 멀티모달 모델… “외부 안전성 평가 완료”

회원가입 후 뷰스레터를 주 3회 무료로 받아보세요!

[GTC 특집] 엔비디아, 왕조시대를 선언하다

잠 못 드는 당신, 계절 때문입니다

AI 인피니티 5

오픈AI 최신 모델 GPT-4o 벤치마크 점수 능가
전 세대 대비 속도 2배 빠르고 저렴… 코딩 능력 탁월
첨단 시각 능력 갖춘 멀티모달 모델… “외부 안전성 평가 완료”

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!