올 4월 팀장→대표 파격 인사

리더십 우려에도 성과 가시화

초거대AI 공개 이어 헬스케어·교육에 AI 적용

[아시아경제 강나훔 기자] ‘88년생 카카오 계열사 대표.’

지난 4월 김일두 카카오브레인 딥러닝 알고리즘 연구팀장이 회사 대표로 선임된다는 소식이 전해지자 IT업계가 술렁였다. 30대 팀장을 자회사 대표 자리에 앉힌 김범수 카카오 이사회 의장의 결단에 대한 놀라움과 신임 대표의 리더십에 대한 우려가 동시에 섞여나왔다.

2017년 2월 설립된 카카오브레인은 임직원 60여명이 모여 인공지능(AI) 원천 기술을 전문적으로 연구하는 카카오의 자회사다. 규모는 작지만 미래 산업의 핵심인 AI를 전문적으로 다룬다는 점에서 30대 대표의 등장은 가히 파격적이라고 할 수 밖에 없다.

그러나 김 대표의 이력을 보면 ‘파격 인사’라는 말이 무색할 정도로 화려하다. 그는 2012년에 카카오 소프트웨어 엔지니어로 입사해 약 7년간 AI 관련 다양한 서비스 연구·개발 경험을 가지고 있다. 2018년부터 딥러닝 알고리즘 연구팀에 AI 엔지니어로 합류해 컴퓨터 비전, 데이터 증강 기술, 의료진단 등 다양한 AI 기술 분야를 담당하며 개발 역량을 입증해왔다. 지난 3년간 다수의 권위 있는 국제 학회에 10여편의 논문을 등재했으며 국제 AI, 기계학습 대회에서 8차례나 입상했다.

그의 대표적인 연구·수상 사례로는 신경정보처리시스템 및 의료진단 분야가 있다. 지난해 신경정보처리시스템학회 ‘뉴립스(NeurIPS)’에서 선보인 최신 데이터 증강 기술 연구는 학습 연산시간을 60배 이상 줄임으로써 다수의 AI 분야연구자에게 호평받았다. 같은 해 열린 폐암 조기 진단 흉부 CT(컴퓨터단층촬영) 영상 분류 알고리즘 추천 대회인 ‘LNDb(폐 결절 데이터베이스) 그랜드 챌린지(Grand Challenge)’에서 우승하며 AI 기술을 다른 산업 분야의 문제에 접목해 해결할 수 있다는 것을 입증해내기도 했다.

김 대표는 취임하면서 올해를 카카오브레인의 새로운 도약을 시작하는 ‘카카오브레인 시즌 2’로 정의했다. 자신의 엔지니어 역량과 리서치 역량을 총동원해 AI 연구를 더 속도감 있게 추진하고 신사업 성장을 공격적으로 이끌겠다는 포부다.

그가 취임한 지 8개월, 성과도 가시화 하고 있다. 카카오브레인은 최근 초거대 AI모델 ‘KoGPT(코지피티)’와 ‘minDALL-E(민달리)’를 공개했다. 코지피티는 한국어 초거대 언어모델이다. 민달리는 이용자가 텍스트를 명령어로 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 1400만장의 텍스트와 이미지 세트를 사전 학습하고, 13억개의 파라미터(매개변수)를 가지고 있다.

특히 카카오브레인은 KoGPT 모델의 성능 고도화에도 집중하고 있다. 구글에서 개발한 텐서 처리 장치인 ‘구글 TPU’를 활용해 1엑사 플롭스(컴퓨터의 연산 속도 단위·초당 100경 연산처리)를 뛰어넘는 국내 최대 규모의 딥러닝 슈퍼컴퓨팅 인프라를 도입해 연구 효율을 높였다. 또 KoGPT 모델의 매개변수를 60억개에서 300억개로 5배 늘려 이전보다 더 정확하게 명령을 이행할 수 있도록 만들었다.

현재 김 대표의 눈은 ‘헬스케어’와 ‘교육’에 쏠려 있다. 김 대표는 지난 20일 가진 기자간담회에서 "AI가 세상을 바꾸는 기술로서 의미를 가지도록 도전하려고 한다"며 "그중에서도 헬스케어와 교육이 고부가가치를 내는 분야"라고 말했다.

이와 관련 카카오브레인은 현재 단백질 구조를 예측하는 AI 기술을 개발하고 있다. AI 신약 설계 플랫폼 기업 ‘갤럭스’에 50억원 규모 투자도 단행했다. 신약 개발의 경우 후보 물질 개발에만 평균 5년이 소요되고 6억7000만달러(약 7900억원)의 비용이 투입되는 데 비해 성공률은 10% 미만으로 위험도가 높은 분야다. 카카오브레인은 AI를 통해 신약 개발 시간과 비용을 대폭 줄이겠다는 구상이다. 카카오브레인은 이와 함께 언어교육, 코딩교육을 돕는 AI 개발도 검토 중이다.

김 대표는 내년에도 AI 원천 기술 연구를 확대해 사회적 영향력이 큰 AI 서비스 전개를 목표로 하고 있다. 그는 "카카오브레인은 차별화된 연구 기술을 선도해가면서 이 기술들이 세상에 중요한 문제에 쓰여지게 할 것"이라며 "20억건 수준의 이미지-텍스트 데이터를 기반으로 사람 같은 AI를 실현할 수 있도록 연구하고 있고, 이를 일부 공개해 AI 산업 전반에 기여할 수 있는 방안도 검토 중"이라고 말했다.

