구글 번역 더 정확해진다…인공지능으로 오류 최대 85% 낮춰
신경망 기계번역 기술, 단어 아닌 문장 단위로 해석…부드러운 문맥 형성
총 103개 언어 번역 지원할 것…데이터 쌓일수록 학습능력·정확도 향상
온라인 번역프로그램에 고도화된 인공지능(AI) 기술이 접목되면서 보다 빠르고 정확한 번역서비스가 상용화될 전망이다.
버락 투로프스키 구글 번역 부문 프로덕트 매니지먼트 총괄은 29일 서울 역삼동 구글코리아 사무실에서 실시간 영상회의로 AI기술을 통해 향상된 구글 번역의 ‘신경망 기계번역 기술’을 설명했다.
기존의 번역 프로그램들은 입력된 문장이 단어와 구 단위로 쪼개져 하나하나가 개별로 번역 됐었다. 이러한 탓에 관용어, 어려운 문법이 포함된 문장은 대부분 알아들을 수 없거나 원문과는 상이한 번역결과가 나오기도 했다.
그러나 구글의 신경망 기계번역(Google Neural Machine Translation, GNMT) 기술은 인간의 언어 구사 방식과 유사하게 문장을 하나의 번역 단위로 간주해 보다 부드러운 문맥을 만든다.
버락 매니지먼트 총괄은 “뉴스 매체의 샘플 문장을 기준으로 언어 조합을 테스트해본 결과 기존 번역대비 오류가 55%~85% 가량 줄었다”며 “문맥을 중시해 문장 전체로 번역한다는 점에서 지난 10년 간의 업데이트 이상의 도약"이라고 강조했다.
현재 GNMT 기술이 적용된 언어는 한국어, 영어, 프랑스어, 독일어, 중국어, 일본어 등 8개 언어 조합으로 지난 15일 구글 번역 웹, 어플리케이션에 반영된 바 있다.
구글은 GNMT 기술의 끊임없는 트레이닝을 통해 총 103개 언어의 번역을 지원, 전세계 99% 인구가 언어의 장벽에 구애되지 않도록 하겠다는 포부를 내비췄다. 103개의 언어를 교차 조합하면 총 1만506개의 경우의 수가 발생한다.
이에 대해 버락 매니지먼트 총괄은 “GNMT 기술은 타 언어 간의 연결과정을 분석·도출해 전혀 접한 적이 없는 제 3의 언어도 번역할 수 있다”면서 “구글 번역이 스스로 트레이닝 과정을 거듭해 데이터를 쌓아나가면 언어 학습 능력이나 번역 정확도 측면에서도 더욱 비약적인 발전을 보일 것”이라고 덧붙였다.
©(주) 데일리안 무단전재 및 재배포 금지