환각 줄이고 답변 다양성 높여

수학·과학·코딩 벤치마크 최고 기록

한국어 벤치마크서도 전문가 수준 뛰어넘어

OpenAI의 차세대 플래그십 모델 GPT-5가 출시됐다. GPT-5는 이전보다 한 단계 진보한 가장 똑똑하고, 빠르고, 유용한 프런티어 모델이다. 사진=오픈AI

"토성의 고리 수가 몇 개인지 묻자 GPT-4o는 6.5초, GPT-5는 3.1초 걸렸다."

구독자 2130만명을 보유한 영국 테크 유튜버 '미스터후즈더보스(Mrwhosetheboss)'가 직접 GPT-4o와 GPT-5를 비교한 결과다. 아이폰 출시 모델 수(11.2초 vs 8.3초), 포켓몬 타입 조합의 개수(11초 vs 5초) 등 짧고 단순한 질문에서 GPT-5는 이전 세대보다 30%~55% 빠른 속도를 자랑했다. 그는 "복잡한 코딩이나 게임 생성처럼 깊은 추론이 필요한 작업은 속도가 약간 더 걸릴 수 있지만 결과물의 질이 높아졌다"며 "일상적인 정보 질의에서는 확실히 빨라졌다"고 평가했다.

11일 IT업계에 따르면 오픈AI는 지난 7일(현지시간) 챗GPT의 최신 기반 모델 'GPT-5'를 공개했다. 이번 모델은 기존 대화형 'GPT-4o'와 추론 특화 'o3'를 한 단계 업그레이드해 하나로 통합했다. 이제 챗GPT를 쓸 때 모델을 따로 고를 필요가 없다.

샘 올트먼 오픈AI 최고경영자(CEO)는 출시 전날 "GPT-5는 큰 도약이자 범용인공지능(AGI)을 향한 중요한 진전"이라며 "GPT-3는 고등학생, GPT-4는 대학생과 대화하는 느낌이었다면 GPT-5는 박사급 전문가와 대화하는 느낌"이라고 말했다. 그는 "GPT-5를 써본 뒤 GPT-4로 돌아가는 건 정말 힘들었다. 아이폰이 저해상도 화면에서 레티나 디스플레이로 바뀌었을 때처럼, 예전으로 돌아가고 싶지 않은 기분"이라고 덧붙였다.

오픈AI는 GPT-5가 수학·과학·코딩 등 주요 벤치마크에서 최첨단 성능(SOTA)을 기록하고 '환각(hallucination)' 발생률을 줄였다고 밝혔다. 답변 속도는 빨라졌으며 같은 질문에 다양한 답변을 제공해 선택 폭을 넓혔다.

오픈AI는 GPT-5를 모든 챗GPT 이용자에게 개방했다. 무료 이용자는 GPT-5와 경량 버전 'GPT-5 미니(mini)'를 쓸 수 있으며, 5시간당 10회 메시지 한도가 적용된다. 플러스 요금제 이용자는 3시간당 80회까지 GPT-5를 사용할 수 있고, 한도 초과 시 경량 버전으로 전환된다. 프로 요금제는 메시지 제한 없이 GPT-5와 심화 추론 모드 '싱킹(Thinking)'을 자유롭게 이용할 수 있다. 팀 요금제도 프로와 동일한 무제한 혜택을 제공하며, 다음 주부터 GPT-5가 기본 모델로 적용된다.

특히 GPT-5는 한국어 평가 벤치마크(KMMLU)에서도 최고 성적(SOTA)를 기록했다. 오픈AI는 "이는 GPT-4o에서 시작한 한글 처리 기술을 개선한 결과로, 현대 한국어뿐 아니라 문화·역사 지식까지 평가하는 시험에서 얻은 성과"라고 설명했다.

속도와 성능 수치만 보면 개선 폭이 뚜렷하지만, 전문가들은 이번 업데이트의 핵심이 다른 곳에 있다고 본다. 최병호 고려대 인공지능연구소 교수는 "GPT-5는 단순히 성능 지표를 높이는 것보다, 다양한 버전과 추론·비추론 모델을 AI가 자동으로 선택·조합하는 '라우팅' 구조를 강화했다"며 "다만 이 라우팅이 아직 완벽하게 작동하지 않아 체감 성능이 일정 부분 제한될 수 있다"고 분석했다.

최 교수는 또 "방향성이 B2C(일반 소비자)에서 B2B(기업) 쪽으로 이동한 흔적이 뚜렷하다"며 "코딩, 의료·건강, 엔터프라이즈 분야에 최적화하면서도 '범용 검증기'와 같은 품질 강화 기술을 도입했다. 복잡한 작업에서 정확성을 높이는 대신 대화가 다소 무미건조해지고, 기존 사용자가 느끼던 친근한 스타일은 줄어든 것"이라고 설명했다. 그는 "일상적인 질의응답에서는 변화가 잘 드러나지 않지만, 복잡한 코딩 요청, 심층 건강 상담, 멀티에이전트 기반 서비스처럼 전문성을 요구하는 작업에서 차이가 두드러질 것"이라고 덧붙였다.

한편 AI 플랫폼 기업 뤼튼은 지난 8일 GPT-5 유료 버전을 무료·무제한으로 제공하기 시작했다. 자사 애플리케이션(앱)과 웹에 GPT-5 전용 메뉴를 신설해 이용자 누구나 제한 없이 활용할 수 있도록 했다. 뤼튼은 지난해에도 국내 최초로 GPT-4를 무료로 제공한 바 있다.





박유진 기자 genie@asiae.co.kr



