구글 번역 얼마나 정확할까? 가장 번역이 정확한 언어 쌍

9월 28, 2020 | 기계번역, 번역

Google translate

구글 번역기의 장점과 단점

구글 번역(Google Translate; GT)은 세계 최고의 번역 소프트웨어로 103개 언어, 1만여 개 언어 쌍을 지원하고, 매일 약 5억건의 번역 요청을 처리합니다. 전문가들은 구글 번역의 인공신경망이 글자뿐만 아니라 오디오와 비디오 파일의 번역도 곧 처리할 수 있게 될 것이라 얘기하고 있으며, 이에 따라 기계번역 발전의 빠른 진전이 기대됩니다. 이러한 방향성의 첫 단계는 이미 시작되어, 현재 비디오와 오디오를 능동적으로 분석할 수 있는 알고리즘이 개발되고 있습니다.

구글 개발자들은 2016년 인공신경망을 기반으로 번역 품질을 크게 향상시킬 목적으로 신경망 기계 번역 시스템(Neural Machine Translation System; GNMT)을 도입했습니다. 그 덕분에 학생들은 과거보다 훨씬 더 빨리 온라인에서 과제를 찾아 구매 할 수 있을 것입니다. 그 후 3년이 지났으니, 이제 우리가 그 효과를 평가할 시간이 되었습니다. 번역 품질은 정말 향상했을까요? 이를 더 발전시키기 위해서는 어떤 것을 할 수 있을까요?

구글 번역 알고리즘은 어떻게 작동할까?

기계 번역의 신경 모델은 표준 번역 방법에 의존합니다. 신경망 도입 이전의 번역은 대개 한 단어 한 단어를 번역하는 방식으로 이루어졌는데, 이 시스템은 기본적인 문법 규칙을 고려하여 별도의 단어와 구문을 간단히 번역하는 방법이었기 때문에 번역 품질에 있어 아쉬운 점이 많았었죠.

현대의 신경 시스템에서 가장 작은 단위는 단어가 아니라 단락입니다. 그래서 기계의 연산력은 단어 형태가 아니라 문장의 맥락과 의미에 초점이 맞추어져 있습니다. 이 소프트웨어는 문맥을 고려하여 전체 문장을 번역합니다. 메모리에 수백 여 개의 번역 변형을 저장하지 않고, 대신 본문의 의미에서 작동하여 문장을 사전 세그먼트로 나눕니다.

오늘날 신경망 기계번역 시스템(GNMT)은 32,000여개의 단락을 사용하며, 특수 디코더를 사용하여 구문에서 각 부분의 의미를 결정합니다. 그런 다음 가능한 뜻과 번역 옵션의 최대 수를 계산하고, 마지막 단계로 번역된 부분을 문법에 맞게 결합하는 것입니다. 개발자들에 따르면 이 접근법을 통해 기계 연산력 없이 번역의 빠른 속도와 정확성을 보장할 수 있다고 합니다.

언어의 의미론적, 문법적 특징을 고려하여 번역이 제대로 이루어지기 위해서는 일부 프로그램에서 분리된 모듈과 사전으로 구현된 완전히 다른 소프트웨어 알고리즘을 필요로 합니다. 이를 통해 신경망은 최초 학습 과정에 포함되지 않은 많은 언어 쌍을 처리할 수 있습니다. 예를 들어 영어-일어, 영어-한국어를 번역하도록 학습된 시스템의 경우, 중간 언어로써 영어를 사용하지 않고도 일본어에서 한국어로 쉽게 번역할 수 있습니다.

지난 몇 년간 인공지능(AI)은 이처럼 처음부터 설계되지 않은 언어 간 번역이 가능할 만큼 엄청난 발전을 이루었습니다. 이것은 AI가 번역 과정에서 중간 언어로써 작용하는 자신만의 인공언어 사용하면서 가능해졌는데, 이 인터링구아(Interlingua)라고 부르는 컴퓨터 언어는 사람 사이의 의사소통에는 전혀 적합하지 않습니다.

구글 개발자들이 구현한 번역 방법은 제로샷 번역(Zero-Shot Translation)으로, 중간 인공 언어에 의존하는 보다 정교한 기술입니다. 이 연구분야는 매우 빠르게 발전하고 있으며, 이러한 시스템들이 가까운 미래에는 자동 번역의 주요 수단이 될 것입니다. 시스템의 자가학습 기능은 신경망을 통해 일반 사전에 나오지 않는 슬랭, 전문용어, 신조어까지 정확하게 번역할 수 있습니다. 게다가 신경망은 새롭게 만들어진 단어의 글자까지도 처리할 수 있는데, 고유 명사를 번역할 때 필요로 합니다.

번역 언어 쌍

신경망 기계 번역 시스템으로 가장 많이 사용되는 두 가지 언어 쌍인 스페인어-영어와 프랑스어-영어 간 번역을 개선해온 결과, 번역 정확성은 85%까지 증가하였습니다. 2017년에 구글은 구글 번역을 자주 사용하는 사용자들을 대상으로 대규모 설문조사를 진행했는데, 그 결과는 놀랍게도 신경망에 의존한 번역이 몇몇 언어 쌍에서 거의 완벽에 가깝게 번역되었다는 것입니다. 아래 표는 6점 시스템을 적용한 번역 품질 결과로, 최고점은 6점이며, 최하점은 0점입니다.

통계적 모형 신경망(기계번역) 인간 번역
영어 – 스페인어 4,885 5,428 5,550
영어 – 프랑스어 4,932 5,295 5,496
영어 – 중국어 4,035 4,594 4,987
스페인어 – 영어 4,872 5,187 5,372
프랑스어 – 영어 5,046 5,343 5,404
중국어 – 영어 3,694 4,263 4,636


 

보시는 바와 같이 영어-스페인어와 프랑스어-영어 쌍의 번역 품질 점수는 사람이 직접 하는 인간 번역 점수에 매우 가깝습니다. 이 두 언어 쌍은 구글 번역 알고리즘의 심화학습을 위해 사용되었기 때문에 사실 그리 놀랄만한 일은 아니죠. 다른 언어 쌍들의 경우에는 상황이 좋지는 않지만 해당 언어들에 대한 대규모 설문조사도 여전히 진행 중 입니다. 신경망 번역이 구조적으로 비슷한 언어들 사이에서는 제대로 작동하지만, 일어-핀란드어와 같이 다른 언어 시스템에서의 컴퓨터 번역의 품질은 현저하게 낮은 것이 사실입니다.

구글 번역의 문제점?

구글 번역이나 이와 비슷한 기술들의 실익에 대해서 평가절하 할 수는 없겠지만, 이러한 기계적 접근에는 여전히 부족한 점이 있을 수 밖에 없는데, 이것은 “이해력”이라는 한 단어로 설명할 수 있을 것 같습니다. 컴퓨터 번역은 절대로 기계적 이해에 초점을 맞출 수 없습니다. 소프트웨어 개발자들은 항상 해석법을 개선하고자 노력하거나 반대로 기계를 제외한 분석적 전력을 사용한 번역 작업으로 대응하고 있습니다.

신경망 기계 번역 시스템 개발자들의 주된 목표는 번역 정확성에 있어 최고점을 달성하는 것이 아닙니다. 현재의 기술 발전 단계를 고려해 모든 컴퓨터 번역기가 복잡한 언어 구조를 처리하여 번역속도를 현저히 줄이는 것입니다. 그래서 개발자들은 번역 정확성과 번역 속도 사이의 밸런스를 찾기 위해 노력했습니다.

자, 그럼 구글 번역을 사용해 다음 영어 문장을 프랑스어로 번역해보겠습니다.

In their house, every family member has personal things. There is his big car and her small car, his slippers and her slippers, and his books and hers.
집 안에는 모든 가족 구성원들의 개인 물품들이 있습니다. 그의 큰 차와 그녀의 작은 차, 그의 슬리퍼와 그녀의 슬리퍼, 그의 책과 그녀의 책이 있습니다.

 

다음은 구글 번역 결과입니다.

Dans leur maison, chaque membre de la famille a des objets personnels. Il y a sa grosse voiture et sa petite voiture, ses pantoufles et ses pantoufles, ses livres et les siens.
집에서 각 가족 구성원은 개인 물품들을 가지고 있습니다. 그의 큰 차와 작은 차, 슬리퍼와 슬리퍼, 책과 그의 책이 있습니다.
(본 문장은 구글 번역 결과인 프랑스어를 한글로 변환한 결과입니다.)

 

이 프랑스어 문장을 영문으로 다시 번역하면 아래와 같은 결과를 얻게 됩니다.

In their home, each member of the family has personal belongings. There is his big car and his little car, his slippers and his slippers, his books and his own.
집 안에서 가족 각 구성원들은 개인 물품들을 가지고 있습니다. 그의 큰 차와 그의 작은 차, 그의 슬리퍼와 그의 슬리퍼, 그의 책들과 그 자신(의 것)이 있습니다.

 

여기에서 문제는 프랑스어를 포함한 라틴계열 언어에서 명사는 성(性)을 가지고 있고, “his(그의)”과 “her(그녀의)”에 해당되는 소유대명사들이 그들의 주인인 소유자를 의미하는 것이 아니라 물건의 성을 의미한다는 것입니다. 그런데 구글 번역은 이러한 의미와 번역된 문장을 일치시켜서 이해하지는 못합니다. 물론 이 문장이 개인적인 물건을 가진 가족의 구성원에 대한 것이라는 건 명확하죠. 예를 들어, 구글 번역에서는 여성형 명사인 자동차에 대해 번역할 때 여성 단수 소유형용사인 “sa”를 두 자동차에 동일하게 사용하였고, 역시 여성형 명사인 슬리퍼에도 복수 소유형용사인 “ses”를 사용해 번역했습니다. 이 때문에 누가 어떤 크기의 자동차를 가지고 있는 지 알 수 없게 되었고, 결과적으로 구글 번역이 생성한 번역은 원래의 의미를 전달하는 데 실패했다는 것입니다.

이 소프트웨어에서는 문장에서 가장 중요한 정보를 간단히 무시했습니다. 사람들은 중요한 세부요소를 이해하지만 구글 번역은 그저 단어와 글자로 구성된 행을 처리하며, 내포된 의미를 이해하지 않고 문자의 조각들을 빠르게 처리합니다. 그래서 고급 AI 기술에 의존한 번역 시스템이라고 하더라도 정확하지 않거나 틀릴 수 있습니다.

일라이자 효과 (The Eliza effect)

모든 기계나 컴퓨터 장치, 소프트웨어에서 말을 사용하는 것은 중요합니다만, 기계는 단어의 깊은 의미를 절대로 이해할 수 없습니다. 1960년대에 일라이자(Eliza)라는 기계 장치가 설계되었는데, 질문과 답변을 임의로 조정하여 지능적인 기계라는 인상을 불러일으켰습니다. 그 이후로 기계가 인간과 똑같이 생각을 할 수 있다고 여기는 것을 일라이자 효과라고 부르고 있습니다.

수 십 년간 소프트웨어 개발자들과 AI 연구원들은 일라이자 효과에 영향을 받아오고 있습니다. 대부분의 구글 번역 사용자들은 이 소프트웨어가 적어도 언젠가는 단어의 뜻을 이해할 것이라고 주장합니다만, 그것은 사실이 아닙니다. 구글 번역은 언어 이해에 대한 문제를 단순히 건너뛰는 것뿐입니다. 물론 구글 번역도 가끔 괜찮게 들리는 문장을 만들 수도 있겠죠.

심지어 한 두 개 정도의 구절을 완벽하게 번역해낼 수도 있는데, 이러한 점이 구글 번역이 글의 의미를 이해한다는 환상을 만들어냅니다. 그러나 구글 번역은 인간과 같이 스스로 생각을 할 수 없으며 특정한 방법 내에서 글을 처리하는 것뿐이라는 사실을 잊어서는 안됩니다. 컴퓨터 프로그램은 기억능력과 상상능력이 없고, 단어의 숨겨진 의미를 이해할 수도 없으며, 다만 빠르게 처리할 뿐입니다.

그러나 미래에도 컴퓨터 장치가 인간과 같이 생각할 수 없을 것이라 장담할 수도 없습니다. 아마도 몇 가지 서로 다른 언어들 간의 번역을 훌륭하게 해낼 지도 모르고, 심지어 농담, 말장난, 소설, 시, 에세이도 잘 번역할 수도 있다고 생각합니다. 어쨌든 현대 기술은 아주 빠르게 발전하고 있으니까요.