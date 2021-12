김일두 카카오브레인 대표가 내년 글로벌 최대 규모의 멀티모달(multi-modality) 인공지능(AI)을 공개하겠다고 20일 밝혔다.

김 대표는 이날 오전 기자간담회에서 "글로벌 최대 규모의 이미지 텍스트 멀티모달 데이터셋을 구축하고 모델과 함께 공개할 계획"이라고 설명했다. 멀티모달은 텍스트와 이미지 학습을 넘나드는 AI 모델이다. 멀티모달은 텍스트, 이미지, 영상 등 다양한 영역을 AI가 동시에 이해하고 복합적인 결과물을 도출할 수 있다.

그는 "구글의 경우 18억건의 데이터셋을 구축했고, 오픈AI의 경우 10억건을 만들었다"며 "카카오브레인의 경우 20억건의 데이터셋을 구축했고 이미지와 텍스트를 동시에 이해할 수 있는 모델을 내년 1월 일부 공개할 것"이라고 덧붙였다.

카카오브레인은 앞서 초거대 AI모델 ‘KoGPT(코지피티)’와 ‘minDALL-E(민달리)’를 공개했다. 코지피티는 한국어 초거대 언어모델이다. 민달리는 이용자가 텍스트를 명령어로 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1400만장의 텍스트와 이미지 세트를 사전 학습하고, 13억개의 파라미터(매개변수)를 가지고 있다.

카카오브레인의 AI가 적용될 분야로는 '교육'과 '헬스케어'를 점찍었다. 그는 "교육과 헬스케어 정도 분야에서는 난제성 이슈들을 해결할 수 있을 것 같다"고 말했다. 카카오브레인은 카카오의 헬스케어 사내독립기업(CIC)과도 협업을 이어간다는 계획이다. 그는 "카카오브레인은 차별화된 연구 기술을 선도해가면서 이 기술들이 세상에 중요한 문제에 쓰여지게 할 것"이라며 "20억건 수준의 이미지-텍스트 데이터를 기반으로 사람 같은 AI를 실현할 수 있도록 연구하고 있고, 이를 일부 공개해 AI 산업 전반에 기여할 수 있는 방안도 검토 중"이라고 전했다.

