김동환 대표 "멀티모달 학습 데이터 불충분…구축·개방을"
과기정통부-NIA 밋업 행사
김동환 포티투마루 대표는 28일 "멀티모달 학습 데이터에 대한 투자가 많이 이뤄져야 한다"고 말했다.
김 대표는 이날 서울 중구에서 과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 개최한 '데이터 중심 AI 가속화 밋업' 행사의 기조연설에 나서 이같이 말했다.
그는 오픈AI가 개발한 소라(Sora)와 GPT-4o처럼 텍스트뿐만 아니라 음성, 이미지, 동영상까지 결합한 멀티모달(Multi-modal) 기술에 대해 소개했다.
김 대표는 "내년까지는 멀티모달 기술 고도화와 데이터 학습에 대한 경쟁이 치열해질 것"이라며 "국내에는 멀티모달을 위한 학습 데이터가 충분하지 않다"고 진단했다.
이어 "공개된 데이터가 별로 없어 기업들이 손을 못 대고 있는 경우가 많다"고 업계 상황을 전했다. 그는 AI 모델이 제대로 작동하려면 데이터의 전처리 과정도 중요하다고 말했다. 그러면서 "때로는 데이터를 정리하고 정비하는 작업에 더 많은 시간과 비용이 들기도 한다"고 했다.
그는 "현재의 초거대 AI 접근 방식은 대용량의 데이터 학습을 수반하는 경우가 많다"면서 "데이터 구축과 개방이 필요하고, 인프라 투자가 적극적으로 이뤄져야 한다"고 재차 강조했다.
아울러 조선·해양, 자동차 정비, 자금세탁 수사 등의 분야 업무는 경험과 노하우가 많은 '베테랑'에게 맡겼다면 이제는 AI가 그의 업무를 일부 대신하고 있다고 설명했다.
꼭 봐야 할 주요 뉴스
삼성 주춤하자 무섭게 치고 올라왔다…1년 만에 흑...
김 대표는 "조선·해양 분야에서 LNG 선박 설계도를 만들 때 50여명의 엔지니어가 투입되고 10개월~1년 정도 기간이 소요된다"며 "2~3년 안에 AI가 일주일 내에 만들어줄 수 있는 수준으로 발전할 것"이라고 내다봤다.
<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>