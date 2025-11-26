오픈AI 챗GPT보다 응답 빨라

구글 "GPT-5보다 뛰어난 점수"

"이 문제는 기하학적 성질과 대수적 계산을 결합해 해결해야 하는 고난도 문제입니다. 단계별로 풀이를 진행해 보겠습니다."

구글의 인공지능(AI) 챗봇 서비스 '제미나이'에게 2026학년도 대학수학능력시험(수능) 수학 기하 선택과목의 29번 문제를 제시한 뒤 풀이를 요청해봤다. 이 문제는 여러 조건이 걸려 있는 데다 문제 풀이를 위한 도형까지 제시돼 AI가 여러 조건을 분석해야 했다. 2분이 조금 넘는 시간 동안 사고 과정을 거치던 제미나이는 풀이 과정을 차근차근 설명한 끝에 단답형 주관식 문제의 정답을 맞혀냈다. 반면 오픈AI의 챗GPT는 생각하는 과정에만 5분이 넘게 걸렸고, 내놓은 답 역시 오답이었다.

구글의 거대언어모델(LLM) 제미나이 3. AD 원본보기 아이콘

구글이 차세대 AI 모델인 '제미나이 3.0'의 성능이 주목받고 있다. 경쟁 AI 모델 대비 뛰어난 성능을 내는 것으로 평가받으면서다. 제미나이 3.0에 대한 호평이 쏟아지는 가운데, 고난도 추론이 필요한 문제들을 중심으로 실제 모델을 사용해봤다.

제미나이 3.0은 복잡한 문제를 풀어내는 성능이 다른 모델 대비 뛰어났다. 제미나이에서 '사고 모드'를 선택해 '제미나이 3.0 프로' 모델에게 2026학년도 수능 수학 과목의 고난도 4점 문제 8개를 선정해 풀도록 한 결과, 모든 문제에서 정답을 맞혀냈다. 사고 모드를 선택하면 고난도 문제 해결에 특화된 추론 모델이 쓰인다. 문제의 정답을 풀어내는 과정 역시 일목요연하게 정리해냈고, 문제에 포함된 수식이나 도표, 도형들도 정확하게 인식했다.

AI 챗봇 시장의 최대 경쟁자로 꼽히는 오픈AI의 챗GPT와 비교했을 때도 문제 해결의 정확도와 풀이 속도에서 앞섰다. 동일한 수능 수학 문제를 똑같이 챗GPT(GPT-5.1 사고 모델)에게 풀도록 한 결과, 1개 문제에서 오답을 냈다. 문제 풀이 속도도 제미나이 3.0이 GPT-5.1 모델의 절반에 불과했다. 수능 수학 기하 선택과목의 30번 문항 풀이를 제미나이와 챗GPT에게 동일하게 시켜본 결과, 제미나이는 1분23초만에 풀어냈지만, 챗GPT는 3분15초 만에 정답을 구했다. 나머지 문제들의 풀이 속도도 비슷한 경향을 보였다.

구글은 출시 직후부터 제미나이 3.0의 성능이 뛰어나다고 자신해왔다. 순다 피차이 구글 최고경영자(CEO)도 제미나이 3.0이 공개된 지난 18일(현지시간) 구글 공식 블로그를 통해 "모든 제미나이 모델의 능력을 한데 모은 가장 똑똑한 모델"이라며 "어떤 아이디어든 구현할 수 있게 될 것"이라고 강조했다. 실제 AI 모델의 성능을 평가하는 벤치마크 지표에서도 제미나이 3.0은 오픈AI의 GPT-5를 비롯한 기존 경쟁 모델들보다 뛰어난 점수를 보였다는 게 구글의 설명이다.

이용자가 직접 평가하는 'LM아레나 리더보드'에서 기존 수위권이었던 xAI의 그록4.1과 제미나이2.5프로를 제치고 1501점으로 정상을 차지했다. 박사급 문제들의 추론 능력을 측정하는 HLE에서도 GPT-5를 제치고 37.5%로 최고 점수를 받았다. 경시대회 수준의 수학 문제 중에서도 가장 어려운 문제로 구성된 '매스아레나 에이펙스'에서는 기존 최고 점수인 5.21%를 크게 능가해 23.4%를 기록했다.

제미나이의 수능 수학 20번 문항 풀이과정. 원본보기 아이콘

오픈AI의 샘 올트먼 최고경영자(CEO)는 제미나이 3.0의 출시 이후 "이제 우리가 쫓아가는 입장"이라며 당분간 분위기가 좋지 않을 것이라고 말했고, xAI와 테슬라의 CEO인 일론 머스크도 자신의 엑스(X) 계정을 통해 제미나이에 이례적으로 "축하한다"는 메시지를 남기기도 했다.





이명환 기자 lifehwan@asiae.co.kr



AD



<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>