본문 바로가기
Dim영역

AI 번역기 1등 비결은 'NMT'…인간은 아직 '넘사벽'

스크랩 글자크기

글자크기 설정

닫기
인쇄 RSS
네이버, 200자 넘으면 SMT 번역으로 자동 전환
SMT 방식으로 답안 제출해 구글에 밀려
NMT 방식은 문장 전체 넣어 번역, SMT 방식보다 2배 정확
SMT는 구 단위로 번역해 문장 어색


21일 서울 세종대학교에서 열린 '인간 대 기계의 번역대결'에서 출제진이 기계 번역을 시행하기 전에 기념촬영을 하고 있다.

21일 서울 세종대학교에서 열린 '인간 대 기계의 번역대결'에서 출제진이 기계 번역을 시행하기 전에 기념촬영을 하고 있다.

AD
원본보기 아이콘
[아시아경제 한진주 기자] 인공지능(AI) 번역기 간 성능 격차를 벌린 핵심 요인은 관련 기술로 볼 수 있다. 인공신경망 번역(NMT) 기술이냐, 통계 기반 번역(SMT) 기술이냐에 따라 크게 다른 결과를 보여줬다.

NMT는 구글과 네이버( NAVER ) 등이 자사 번역기에 앞다퉈 적용한 기술이다. 한때 '어색함의 대명사'라는 오명을 뒤집어쓴 구글 번역은 NMT 방식을 적용한 이후 한층 자연스러워졌다는 평가를 받고 있다. 이번 대회에서 구글이 1등을 할 수 있었던 비결은 NMT 기술을 기반으로 했기 때문이다.

NMT 방식은 '문장' 전체를 넣어서 번역한다. 이렇다 보니 SMT 방식보다 정확도가 2배가량 높은 것으로 평가된다. NMT 방식은 번역하려는 문장과 번역된 문장을 쌍으로 두고 최적의 답을 찾는 중간값을 학습한다. 번역된 데이터를 활용해서 컴퓨터가 스스로 최적의 가중치를 두는 방식을 학습하는 것이다.
기존에 쓰이던 SMT 방식은 많은 사람이 번역할 때 사용한 데이터베이스를 바탕으로 학습된 확률값에 따라 번역하는 방식이다. 번역하는 단위가 단어들로 구성된 구(Phrase)다. SMT 방식의 번역 서비스는 단위마다 번역해서 조합하는 방식이기 때문에 문장 내에서도 연결이 어색하다는 단점이 있다.

한국어-영어 번역에 NMT 방식을 먼저 적용한 것은 네이버다. 지난해 10월 파파고에 NMT 방식을 적용했는데 200자 이내로 글자 수가 제한된다. 구글은 지난해 11월 한국어와 영어 간 번역에 NMT 방식을 접목했다. 5000자 이내로는 NMT 방식의 번역 결과를 제공한다. 구글은 내부의 '번역품질개선 평가기준'을 통해 NMT 방식 적용 이후 한국어 번역 품질이 0.94점의 개선 효과를 나타냈다고 밝힌 바 있다.

구글 번역

구글 번역

원본보기 아이콘


이번 대회에서 네이버가 구글에 밀린 것은 네이버의 경우 SMT 방식으로 답안을 작성했기 때문이다. 이번 문제는 모든 예시 문장이 철자 기준으로 200자를 넘었다. 이에 네이버 번역기는 자동으로 SMT 방식을 적용, 어색한 답안을 제출하고 만 것이다. 이런 점을 의식, 네이버는 오는 5월 중 NMT 방식 번역의 제한 글자 수를 늘릴 계획이라고 밝혔다. 네이버는 현재 영어-한국어, 한국어-중국어 쌍에 NMT 방식을 적용 중이다.

구글이 상대적으로 나은 결과를 도출했다고는 하지만 아직은 인간 번역사에게 한참 밀린다. 번역에서는 문법이나 문맥, 행간의 의미까지 파악해내는 것이 중요한데 현재 AI는 이 부분에서 미흡하기 때문이다. 곽중철 한국외국어대학교 교수는 "글에는 인간의 말과 인간의 감성과 감정, 분노가 녹아들어 있는데 AI가 아무리 발전해도 정복하지 못하는 부분이 있다"며 "아무리 AI가 번역을 잘한다고 해도 인간이 중요한 결정을 해야 하는 번역물을 기계에 맡길 순 없을 것"이라고 말했다.




한진주 기자 truepearl@asiae.co.kr
AD

<ⓒ투자가를 위한 경제콘텐츠 플랫폼, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

이슈 PICK

  • 김호중 "거짓이 더 큰 거짓 낳아…수일 내 자진 출석" 심경고백 [포토] 오동운 후보 인사청문회... 수사·증여 논란 등 쟁점 오늘 오동운 공수처장 후보 인사청문회…'아빠·남편 찬스' '변호전력' 공격받을 듯

    #국내이슈

  • "눈물 참기 어려웠어요"…세계 첫 3D프린팅 드레스 입은 신부 이란당국 “대통령 사망 확인”…중동 긴장 고조될 듯(종합) 골반 붙은 채 태어난 샴쌍둥이…"3년 만에 앉고 조금씩 설 수도"

    #해외이슈

  • [포토] 검찰 출두하는 날 추가 고발 '시스루 옷 입고 공식석상' 김주애 패션…"北여성들 충격받을 것" 이창수 신임 서울중앙지검장, 김 여사 수사 "법과 원칙 따라 제대로 진행"

    #포토PICK

  • 기아 EV6, 獨 비교평가서 폭스바겐 ID.5 제쳤다 車수출, 절반이 미국행인데…韓 적자탈출 타깃될까 [르포]AWS 손잡은 현대차, 자율주행 시뮬레이션도 클라우드로

    #CAR라이프

  • [뉴스속 용어]이란 대통령 사망에 '이란 핵합의' 재추진 안갯속 [뉴스속 용어]한-캄보디아 정상 '전략적 동반자 관계' 수립 세계랭킹 2위 매킬로이 "결혼 생활 파탄이 났다"

    #뉴스속OO

간격처리를 위한 class

많이 본 뉴스 !가장 많이 읽힌 뉴스를 제공합니다. 집계 기준에 따라 최대 3일 전 기사까지 제공될 수 있습니다.

top버튼