본문 바로가기
Dim영역

엔씨·고려대, AI 대화 데이터셋 'FoCus Dataset' 공개

뉴스듣기 스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS
엔씨·고려대, AI 대화 데이터셋 'FoCus Dataset' 공개
AD
원본보기 아이콘


[아시아경제 강나훔 기자] 엔씨소프트가 임희석 고려대학교 교수 연구팀과 공동연구를 통해 구축한 인공지능(AI) 대화 데이터 ‘FoCus Dataset(For Customized conversation dataset)’을 14일 공개했다.


FoCus Dataset은 사용자 개인의 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋이다. 약 8000여 개의 광범위한 주제를 다룬 1만5000개 이상의 대화로 구성돼 있다.

이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.


FoCus Dataset은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다. 현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용이 소요됨에도 불구하고, 실시간 지식과 개인의 경험을 반영하는데 한계를 나타내고 있다.

엔씨·고려대, AI 대화 데이터셋 'FoCus Dataset' 공개 원본보기 아이콘


공동연구팀은 지난 2월 세계 최고 권위의 인공지능 학회 ‘AAAI 2022’에서 해당 연구 논문을 게재 및 발표했다. 오는 10월에는 세계 전산언어학회인 ‘COLING 2022’에서 데이터 활용 경진 대회(Shared Tasks)를 비롯한 연구 성과를 공유하는 워크샵(The 1st Workshop on Customized Chat Grounding Persona and Knowledge)을 고려대와 공동 개최한다.


이연수 엔씨 Language AI Lab 실장은 "최근 NLP 학계에서는 비용 및 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 이번 데이터 공개를 결정했으며, 글로벌 연구 커뮤니티에서 활발한 논의와 기술 개발이 이루어지기를 기대한다"고 말했다.





강나훔 기자 nahum@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

함께 본 뉴스

새로보기

이슈 PICK

  • '허그'만 하는 행사인데 '목 껴안고 입맞춤'…결국 성추행으로 고발 음료수 캔 따니 벌건 '삼겹살'이 나왔다…출시되자 난리 난 제품 수천명 중국팬들 "우우우∼"…손흥민, '3대0' 손가락 반격

    #국내이슈

  • "단순 음악 아이콘 아니다" 유럽도 스위프트노믹스…가는 곳마다 숙박료 2배 '들썩' 이곳이 지옥이다…초대형 감옥에 수감된 문신남 2000명 8살 아들에 돈벌이 버스킹시킨 아버지…비난 대신 칭찬 받은 이유

    #해외이슈

  • [포토] '아시아경제 창간 36주년을 맞아 AI에게 질문하다' [포토] 의사 집단 휴진 계획 철회 촉구하는 병원노조 [포토] 영등포경찰서 출석한 최재영 목사

    #포토PICK

  • 탄소 배출 없는 현대 수소트럭, 1000만㎞ 달렸다 경차 모닝도 GT라인 추가…연식변경 출시 기아, 美서 텔루라이드 46만대 리콜…"시트모터 화재 우려"

    #CAR라이프

  • [뉴스속 용어]"이혼한 배우자 연금 나눠주세요", 분할연금제도 [뉴스속 그곳]세계문화유산 등재 노리는 日 '사도광산' [뉴스속 인물]"정치는 우리 역할 아니다" 美·中 사이에 낀 ASML 신임 수장

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼