‘오픈AI가 구식으로 보인다’ 딥시크 쇼크 기술 분석... 근거 & 쟁점은?

reporter-profile
박원익 2025.01.27 14:19 PDT
‘오픈AI가 구식으로 보인다’ 딥시크 쇼크 기술 분석... 근거 & 쟁점은?
(출처 : shutterstock)

[딥시크 벤치마크 분석 & 업계 평가]
코드포스 2029점·ARC AGI 고효율… 핵심은 가성비
가성비 정말 뛰어날까... 아티피셜 애널리시스의 분석
“퍼스트무버가 되라”… ‘RL 중심’ 알파제로와 비슷
더밀크의 시각: 오픈 소스의 힘… 회의적 시각도

“딥시크(DeepSeek)의 추론 특화 모델 ‘R1’은 이미 같은 비용으로 오픈AI의 o3보다 나은 성능을 냅니다.”

실리콘밸리 유명 벤처캐피털 멘로벤처스의 AI 분야 투자자 디디 다스(Deedy Das)는 27일(현지시각) “o1 모델 대비 25배 저렴하기만 게 아니다”라며 이같이 밝혔다. 자신의 X(옛 트위터) 계정에 오픈AI의 o3 성능 그래프 사진을 올리며 R1과 직접 비교한 것이다. 

그가 공개한 그래프는 AI 모델의 코딩 실력을 평가하는 ‘코드포스(Codeforces)’ Elo 점수 차트. 저비용 환경에서 o3-미니(low) 대비 높은 성능을 발휘할 수 있다는 게 디디 다스의 설명이다.

1월 20일 R1 발표 직후 AI 업계는 R1이 저렴한 비용으로 오픈AI의 첫 번째 추론 특화 모델 ‘o1’과 대등한 성능을 기록했다는 점에 주목했다. 한데 그로부터 단 일주일 만에 R1이 o1의 후속 모델 o3를 능가한다는 분석이 나왔다. 오픈AI의 추론 특화 모델 o3는 지난 12월 20일에 공개된 것으로 아직 정식 출시도 되지 않은 모델이다.

2023년 중국 항저우에 설립된 신생 스타트업이 실리콘밸리 프론티어(frontier, 최첨단) 기업 오픈AI를 능가했다는 소식은 업계를 깜짝 놀라게 하기 충분했다. 오픈AI 출신의 AI 전문가 아라빈드 스리니바스 퍼플렉시티 CEO가 “정말이냐?”는 댓글을 달며 놀라움을 표시했을 정도다. 

R1의 성능이 o3를 능가한다는 구체적 근거는 무엇일까. R1 벤치마크 점수의 의미, R1의 핵심 기술과 쟁점을 살펴봤다. 

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.