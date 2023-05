"삼천포로 빠졌어."

드라마에서 자주 나오는 이 문장은 이야기의 도중에 엉뚱한 곳으로 방향이 흘러갈 때 사용한다. 영어로는 어떻게 번역될까. 구글 번역에 이 문장을 입력하면 "Fall into samcheonpo"라는 결과가 나온다. 영화·드라마 등에서의 대사는 맥락 등을 고려해야 해서 번역이 어렵다. 구어체 번역을 해결하기 위해 나선 스타트업이 엑스엘에이트(XL8)다. 엑스엘에이트의 번역기 '미디어캣'를 통해서는 "You're getting off on a tangent."란 문장이 나왔다. 인공지능(AI)이 드라마의 대사를 학습하면서 이야기의 맥락과 등장인물의 말투를 배운 결과다.

미국 실리콘밸리에 본사를 둔 엑스엘에이트는 2019년 10월 구글과 애플을 그만둔 두 명의 엔지니어가 설립했다. 최고경영자를 맡은 정영훈 대표(사진)는 "미디어 번역 분야에서는 영상에서 화자를 인식해서 적합한 번역을 한다던가, 감정을 실어 번역된 목소리를 영상에 넣어준다든지 구글도 해결하지 못하는 부분들이 많았다"면서 "창업을 해서 이런 문제들을 해결하고 싶었다"고 말했다.

엑스엘에이트의 기계 번역 기술은 글로벌 온라인동영상서비스(OTT)에 공급되는 전 세계 미디어 콘텐츠의 초벌 번역을 담당한다. 이를 아이유노와 같은 번역 전문 서비스 기업에 공급한다. 엑스엘에이트가 초벌 번역 작업을 하고, 이후 파트너사들의 번역가들이 교정해 최종 결과물이 나온다. 최종 결과물은 다시 엑스엘에이트의 학습 데이터로 사용한다. 엑스엘에이트는 80만 시간이 넘는 분량의 영상을 번역했다. 번역한 단어 수와 글자수는 각각 20억개, 100억자다.

이 회사 갖춘 경쟁력은 데이터에 있다. 구글은 보통 인터넷에서 수집하는 웹 페이지를 번역 학습 데이터로 사용한다. 틀린 정보들이 많을 수밖에 없다. 엑스엘에이트는 번역 전문가들이 영상을 여러 번 수정해 번역한 데이터를 가지고 기계를 학습시킨다.

'문맥 파악 기술'도 자랑거리다. 영상에서 성별·등장인물 간의 관계를 파악하거나 주어·목적어가 없어도 화자의 전후 문맥을 파악해서 알아서 번역해주는 기술이다. 이전에는 사람만이 할 수 있었던 영역이었지만 이제는 기계도 언어별 복잡한 차이를 평가해서 고차원적인 번역을 할 수 있게 된 것이다. 앞뒤 문장을 고려해서 최종 번역 결과를 보여주는 방식이다 보니 정확도가 높다. 정 대표는 "기계 번역 엔진을 통해 나온 결과물은 일관성을 유지하고 있어서 번역가들이 사후 편집을 하기에 시간을 효율적으로 사용할 수 있다"면서 "영상 번역 과정에서 약 32%의 시간을 단축해줄 수 있다"고 설명했다.

엑스엘에이트는 고도화된 번역 기술을 온라인 화상 회의로 확장했다. 회사는 올해 '모바일 월드 콩그레스(MWC)'에서 줌(Zoom) 회의에서 사용할 수 있는 실시간 통역 애플리케이션 '이벤트캣 포 줌(XL8 EventCAT for Zoom)'을 공개했다. 조만간 출시 예정인 이벤트캣은 구어체 기반의 데이터를 학습한 기계 번역 엔진을 줌과 결합해 다국어 회의를 실시간으로 통역, 참가자들이 선택한 언어로 실시간 자막을 볼 수 있는 서비스다.

정 대표는 "혁신적인 AI 기술로 언어 장벽을 허물어 모두가 더욱 넓은 세상을 경험하게 할 것"이라며 "일을 할 때 언어로 겪는 어려움, 적절한 통역사를 찾아야 하는 괴로움 등을 우리 기술로 해결해줄 것"이라고 말했다.





임혜선 기자 lhsro@asiae.co.kr



