업스테이지 "자체 개발 AI, 챗GPT 성능 뛰어넘었다"

최유리 기자

입력 2023.08.01 13:51

00분 34초 소요

숏 뉴스 AI 요약 기술은 핵심만 전달합니다. 전체 내용의 이해를 위해 기사 본문을 확인해주세요.

불러오는 중...

허깅페이스 평가 점수서 GPT-3.5 뛰어넘어

업스테이지는 자사가 개발한 생성 인공지능(AI) 모델이 세계 최대 머신러닝 플랫폼 허깅페이스에서 운영하는 '오픈 거대 언어모델(LLM) 리더보드 평가 점수에서 72.3점을 획득, 챗GPT의 기반인 GPT-3.5 성능을 뛰어넘고 1위를 차지했다고 1일 밝혔다.

허깅페이스 오픈 LLM 리더보드는 오픈소스 생성 AI 모델의 바로미터로 꼽힌다. 전 세계 500여개의 오픈 모델들이 추론과 상식 능력, 언어 이해 종합능력 및 환각현상(할루시네이션) 방지 등 4가지 지표의 평균 점수로 경쟁해 순위가 매겨진다.

[사진출처=업스테이지]

지난달 업스테이지가 허깅페이스를 통해 공개한 300억 매개변수 모델은 평균 67점을 획득했다. 같은 날 발표된 메타의 '라마(LLaMA) 2' 700억 매개변수 모델을 추월하고 국내 LLM 첫 1위를 달성했다. 이에 업스테이지는 더 많은 데이터로 최신 라마 2를 파인튜닝한 모델을 내놨다. 그 결과 업스테이지 70B 모델은 리더보드 평가에서 72.3점을 기록했다. 이는 챗GPT의 기반이 되는 GPT-3.5의 벤치마크 평가(71.9점) 점수를 넘긴 것이다.