[2023 IPR포럼]“생성AI, 학습 통한 데이터 확보가 관건”

이정수 플리토 대표

“챗GPT를 한라봉으로 비유한다면 기막힌 한라봉입니다. 사람들은 이 한라봉을 잘라서 다양한 형태로 팔기 시작할 겁니다. 한라봉 하나는 1000원인데, 잘라서 팥빙수를 만들어서 더 비싼 가격에 팔 수 있죠. 이 팥빙수를 만드는 기술이 필요하고, 이를 위해선 데이터가 충분해야 합니다.”


이정수 플리토 대표는 8일 서울 중구 한국프레스센터 19층에서 열린 2023 아시아경제 IPR포럼 ‘행동주의와 AI가 몰고 올 자본시장의 변화’에서 ‘생성AI가 가져올 번역산업의 변화’를 주제로 한 강연에서 이같이 말했다.

이정수 플리토 대표가 8일 서울 중구 프레스센터에서 열린 '제5회 아시아경제 IPR포럼'에서 '생성AI가가져올 번역산업의 변화'라는 주제로 강연을 하고 있다. 사진=윤동주 기자 doso7@

이정수 플리토 대표가 8일 서울 중구 프레스센터에서 열린 '제5회 아시아경제 IPR포럼'에서 '생성AI가가져올 번역산업의 변화'라는 주제로 강연을 하고 있다. 사진=윤동주 기자 doso7@

원본보기 아이콘

이 대표가 운영 중인 플리토는 언어 데이터 및 전문번역 서비스 기업이다. 최근 자사의 인공지능(AI) 번역 엔진에 생성형 AI 기술을 접목한 온라인 번역 서비스 ‘플리토 AI 플러스’를 베타 출시했다. 고품질 언어 데이터를 학습한 ‘플리토 AI번역’을 기반으로 한다는 점에서 생성형 AI를 활용한 여타 서비스들과 차별점을 보인다.


이 대표는 “플리토의 경우 3억개의 언어 데이터를 보유하고 있다”며 “이 3억개 언어를 통해 AI를 만들었고, 25개 언어를 지원 중”이라고 말했다. 그러면서 “많은 데이터를 넣고 학습을 시키면서 기술을 고도화하고 있다”며 “식당, 백화점 등 실생활 곳곳에 AI를 활용한 기술을 적용하고 있다”고 설명했다.


이처럼 AI 시대의 핵심은 데이터다. 다만 저작권 이슈가 있다. 혹자는 “인터넷에 깔린 모든 게 데이터인데, 왜 데이터를 돈 주고 사야 하냐?”고 물을 수 있다. 과거엔 개발자들이 저작권을 고려하지 않고 데이터를 긁어모으던 시절이 있었다. 그러나 2018년 이후 유럽에서 저작권 이슈가 발생하면서 상황이 달라졌다.

이 대표는 “저작권에 대한 엄격한 시각이 있지만, 국내의 경우 다른 양상이 펼쳐지고 있다”며 “오히려 저작권 장벽을 낮춰야 한다는 논의가 시작됐다”고 말했다. 이어 “전 세계적으로 AI 학습을 위한 데이터 저작권을 완화해 달라는 요구가 늘어나고 있다”고 했다.


저작권과 함께 데이터가 기업 구매비용에 포함되는 점도 주목할 부분이다. 이 대표는 “과거엔 식수를 돈 주고 사 먹는 사람은 돈이 많거나, 외국에서 살다 온 사람이라는 인식이 있었지만, 요즘엔 그렇게 생각하지 않는다”면서 “데이터 역시 과거엔 돈을 주고 사야 한다는 생각 자체를 하지 못했지만, 이제는 달라졌다”고 말했다. 이어 “미국 기업은 이제 데이터 관련 예산을 책정하기 시작했다”고 강조했다.


데이터 관련 노동 문제도 이슈다. 현재 챗GPT 개발사 오픈AI는 소송에 휘말렸다. 아프리카 미성년자들을 통해 데이터 정제 작업을 진행했다는 사실이 알려지면서 도마에 올랐다. 과거에는 개발도상국 아이들이 신발, 휴대폰 등을 만들었다면, 이제는 데이터 관련 작업을 하는 시대가 도래 한 것이다.


AI 번역에 있어 상황을 인지하는 게 중요하다는 점도 강조했다. 그는 “챗GPT는 그동안 자신 있게 대답을 해왔지만, 점차 질문을 통해 상황을 이해하려고 한다”며 “다양한 질문을 통해 추가로 데이터를 생성하면서 데이터를 더욱 축적하는 것”이라고 했다. 그만큼 데이터 확보가 중요하단 얘기다.





이광호 기자 khlee@asiae.co.kr

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>