본문 바로가기

돈의 주인되기

딥러닝 번역 시장의 강자는 누가될까?

Papago (Naver Corp. Translator)

구글번역만을 쓰던 때가 있었다. 그러다가 파파고의 존재를 알게 되었다. 네이버에서 딥러닝 기술을 이용해 만든 파파고는 데이터가 누적될수록 품질이 개선이 된다. 네이버 관계자는 2019년에 “아직 베타(시제품) 버전이다 보니 개선의 여지가 적지 않은 게 사실”이라며 “앞으로 활용 사례가 늘어날수록 음성 인식률과 번역 정확도가 함께 높아질 것”이라고 말했다.

 

딥러닝은 인공지능 기술로 인간의 신경망을 닮은 병렬처리 방식을 이용한 기계학습 알고리즘이다. 

 

- 인간의 뇌는 정보를 병렬 처리한다. 즉, 들어오는 데이터를 하나씩 순차적으로 처리하는 계역처리를 하는 것이 아니라 동시 다발적으로 맥락과 연결 및 통합을 하면서 처리하는 것이다. 당연히 인간의 뇌를 본 따 만든 신경망 프로그램을 제대로 구현하기 위해서는 병렬 처리를 할 수 있는 컴퓨팅 능력이 필요하다. 하지만 일반적인 컴퓨터는 계열처리를 하기 때문에 인공 지능 연구를 발전시키는 데에 한계가 있었다. 

  하지만 2009년 스탠퍼드 대학교 앤드루 응(Andrew Ng)은 GPU칩을 통해 신경망을 가동시킬 수 있다는 것을 알아냈다. GPU 그래픽 처리 장치로서 원래 한 이미지에 담긴 화소 수백만 개를 병렬 처리하는 장치이다. 바로 이 GPU를 활용할 수 있게 된 것이다. 구글은 인공지능 전용 처리장치로 TPU까지 개발한 상태이다. 

  기존의 컴퓨터로 1억 개의 매개변수를 지닌 신경망에서 모든 가능성을 계산하는 데 몇 주가 걸렸지만 GPU묶음으로 하루 만에 처리가 가능해진 것이다. 물리적 한계를 넘어섰다. - 고영성, 신영준 지음 <일취월장> p.439 중에서 

 

구글이 TPU까지 개발한 상태이고 마이크로소프트는 중국어 뉴스 기사를 영어로 번역하는 모델이 '인간 수준(전문번역사)'를 실현했다고 2018년 5월에 발표했다. 그 해 여름에 열린 기계 학습관련 국제 회의 'WMT 2018' 에서 영어를 체코어로 번역한 결과가 전문 번역가를 능가하는 '슈퍼 휴먼(인간 능가'이라는 보고도 나왔다. 'WMT 2019'에서는 영어의 독일어 번역이 '인간 능가'라는 보고가 있었다. 일본어와 영어 간의 번역은 아직 '인간 수준'에 미치는 수준이다.

 

WMT는Workshop on Statistical Machine Translation이다. 작년 2019년에는 8월에 이틀간에 걸쳐 이탈리아, 피렌체에서 열렸다. 5번째 워크샵이 될 WMT는 올해 2020년에는 코로나 바이러스의 영향으로 11월 19~20일에 온라인으로 개최된다.

 

Google translate

 

구글에 Best Machine Translation Engines So far라고 치면 여러가지 자료가 나온다. 각 엔진별로 정확도가 높은 언어가 다르다는 것을 감안하면 구글, 마이크로소프트, 바이두라고 지금까지 생각하면 될 것 같다. 언어 인지 인공지능의 경우도 애플의 시리나, 아마존의 알렉사, 구글홈 미니(오케이,구글) 등 스피커 형태의 비서형 음성 인식 서비스를 통해 데이터를 수집하고 있다. 이런 사실들을 알고 나니까 왜 유튜브 프리미엄을 쓰는 사람들에게 유튜브에서 무료로 구글홈 미니를 선물해줬는지 이해가 갔다. 소름이 돋을 정도였다. 그들은 무료라는 이름으로 사실은 자신들의 데이터를 축적하기 위한 목적을 달성하고 있었던 것이다. 공짜에는 다 이유가 있다.

 

Microsoft translator

 

“번역 업계 전체가 벼락을 맞은 듯한 충격을 받았다. 이것은 50년에 한 번 나오는 파괴적인 기술이다.”

자동번역 서비스 사업을 전개하는 엑스트라(Xtra)의 후루야 유이치 사장은 2016년 11월에 미국 구글이 온라인번역 서비스 ‘구글(Google) 번역’의 번역 기술을 종전의 ‘통계 기계 번역(Statistical Machine Translation, SMT)’에서 심층학습 기반의 NMT(Neural Machine Translation)로 전환했을 때의 충격을 이렇게 말한다.

  온라인번역 서비스는 인터넷의 여명기부터 있었다. 다만, 초기에는 정확도가 낮아, 영어를 일어로 번역했을 때 대략적인 의미를 파악할 수 있는 정도였다. 영어 이외의 외국어는 일어로 옮겨도 의미조차 통하지 않는 경우가 많았다. 여기에 오랫동안 사용됐던 번역 기술이 SMT(Statistical Machine Translation)이다. 2000년 전후에 다소 정확도가 향상됐지만, 그래도 사람에게 읽히는 문장으로 출력 결과를 그대로 사용할 수는 없었다.

  이런 가운데, 2013년에 NMT가 등장했다. NMT는 Neural Machine Translation(인공신경망 기반 기계번역)의 약어이다.

 

  파파고의 NMT 기술은 입력 문장을 문장벡터로 변환하는 신경망(encoder)과 문장벡터에서 번역하는 언어의 문장을 생성하는 신경망(decoder)를 대규모의 병렬 코퍼스부터 자동으로 학습한다. 입력문장의 일부가 아니라 문장 전체 정보를 바탕으로 번역을 수행하기때문에 기존 SMT방식의 번역보다 더욱 정확하고 문장 맥락에 맞는 번역을 하는것이 특징이다. 네이버 서비스를 통해 축적해온 번역 품질에 대한 피드백들을 적극적으로 반영해 단순 통계에만 의존하는 기존 기술의 한계를 보완했다. 자연스러운 번역을 가능하게 하는 대규모의 학습 데이터를 보유하고 있다. 언어의 규칙을 효과적으로 파악하는 핵심 번역 기술을 강화하기 위해 품질 높은 학습 모델을 사용한다.

  웹 기반의 콘솔을 통해 쉽고 편리한 사용이 가능하다. RESTful 형태로 지원되는 API를 통해 고객의 서비스에 번역 기능을 간단하게 적용할 수 있다.- 네이버 파파고 소개 참고

 

API가 뭘까? Application Programming Interface의 약자로 프로그램들이 서로 상호작용하는 것을 도와주는 매개체라고 한다.

 

 

 

Baidu tranlate app

 

2013년 NMT(Neural Machine Translation)가 등장하고 3년 후 순식간에 정확도를 높여 2016년에는 번역 정확도의 지표가 되는 ‘블루(Blue) 스코어’가 SMT(Statistical Machine Translation)의 약 20을 넘어섰고, 2018년에는 35까지 올라갔다. 35는 의미가 문제없이 전달되고 문장으로도 자연스럽다고 평가할 수 있는 수준이다.

 게다가 이 값은 블루 스코어가 잘 나오지 않는 영어를 독일어로 번역한 경우다. 영어와 프랑스어 간, 영어와 중국어 간에서는 이미 40대, 즉 고품질 번역이라고 할 수 있는 수준에 도달했다. 일본 정보통신연구기구(NICT)의 스미다 에이이치로 연구원은 “2020년에는 번역 정확도가 블루 스코어에서 60(평균적인 인간을 능가하는 수준)을 넘을 것”이라고 본다.

 

이렇게 딥러닝을 이용한 번역업계의 경쟁구도에 대해서 알아보았다. 구글, 마이크로소프트, 바이두, 그리고 네이버가 어떻게 발전을 거듭할지가 기대된다. 인공신경망 기반 기계번역이 아무리 고도로 발달했다고 하더라도 우리가 영어를 배울 필요가 없다는 건 말이 안된다. 그렇기 때문에 더욱더 영어를 모국어로 사용하는 이들과 함께 경쟁하기 위해서라도 영어를 잘해야한다. 더 많은 위기의식과 동기부여가 끓어오른다.