한영 자동번역기 네이버 vs 구글

어제는 영한번역을 다섯개의 자동번역기를 동원해서 어떤 자동번역기가 가장 자연어에 가까운지 테스트해 보았다.
결과는 역시 국내번역기인 네이버가 구글보다는 훨씬 더 의역까지 더한 자연어에 가까운 번역성능을 보여줌으로써 완전한 압승이었다.
반면에 한영번역은 어떨까?
아무래도 사람이 쓴 글을 로봇이 분석해서 랭킹을 매기는데 있어 타의 추종을 불허하는 구글이 좀 더 낳지 않을까? 하는 궁금증을 못이겨 오늘 다시 자동번역기성능에 관한 포스팅을 해본다.
네이버는 아직은 글의 품질을 정하는데 있어서는 인위적인 면이 구글보다는 훨씬 더 많기 때문에 한영번역만큼은 구글을 감히 따라잡지 못할 것이라고 조심스러운 예상을 해 본다.
지문의 수에서는 어제의 영한번역보다 오늘의 한영번역을 좀 더 중요하게 생각한다는 점에서 8개에서 10개로 늘려보았다.
왜냐하면 현재까지는 주로 영문을 국문으로 바꾸려고 하는 시도가 훨씬 많았지만 앞으로는 국문을 영문으로 옮겨서 해외로 진출하려는 사업자가 부지기수로 늘 것이 당연하기 때문이다.
과연 자동번역기가 '아'다르고 '어'다른 한국어의 정교한 뉘앙스를 마찬가지로 정교하고 복잡한 영어로의 표현이 어디까지가 가능할까?
정말 궁금하지 않을수 없다.
물론 정교한 뉘앙스까지 완벽하게 영어로 옮기려면 전문번역가의 능력이 필요하겠지만 바쁜 이 시대에 어느 세월에 전문번역가를 섭외해서 맡기고 기다렸다가 받아서 검토한 후 글을 발행하겠는가?
중견기업이상의 해외마케팅부서가 없는 중소기업이나 개인기업의 경우는 말이 필요없을 정도다.
전문번역가마저도 초벌번역은 자동번역기의 힘을 빌린다는 이야기를 들었다.
이래도 저래도 역시 자동번역기는 필수인 시대이다.
그럼 시작해 볼까?
어제와 마찬가지로 지문의 난이도는 쉬운것부터 시작해서 갈수록 난해하고 직역만으로는 의미가 충분히 전달되지 않는 관용어구가 들어간 문장 또는 속담으로까지 발전시켜 번역성능을 검토해 보았다.

한영번역사례




1. 그의 조언을 요청해보시는게 어떨까요?
(Why don't you ask for his davice?)

네이버 N : Why don't you ask him for advice?

구글 G : Why don't you ask for his advice?

빙 B : Some ask that question?

SDL S : Why don't you ask his advice?

시트트란 T : Request doesn't try his advice?

비교결과 R : 아주 평이한 문장이다. 
시스트란을 제외하곤 대체적으로 무난한 번역품질이 나왔다.
특히, 구글과 SDL은 원문과 일치하였다.



2. 아이들이 욕을 하는것은 용납할 수 없습니다.
(It is unacceptable for children to swear.)

N : It is unacceptable for children to swear.

G : Children can not tolerate swearing.

B : Kids wearing is unacceptable.

S : Chilidrn cussing, unacceptable tolerate.

T : The children sending an abusive language will not be able to tolerate.

R : 이번 지문에선 어순이 국문과는 반대로 가주어 It이 문장앞으로 가는형태로 번역이 진행되는것을 추천한다.
번역품질이 낮으면 아마도 국문과의 어순이 비슷한 형태로 진행될 것이다.
놀랍게도 네이버가 이 조건을 완전히 충족하였다.
원문과 동일하게 번역을 한 것이다.
반면 구글은 용납할 수 없다라는 표현으로 tolerate란 단어를 사용했다.
용납이란 뉘앙스보다는 인내라는 뉘앙스에 더 가까운 표현이다.
완전 예상이 빗나가는 결과가 아닐수 없다.



3. 저는 서비스 변경에 대해서 알려드리고자 이글을 씁니다.
(I'm writing to inform you about the change of service.)

N : I am writing to inform you of the change in service.

G : I am writing this article to let you know about service changes.

B : I am writing this to inform you about the service changes.

S : Change the service that we would like to inform you about me write this.

T : I inform about the service fringe land in order, this writing I write.

R : 이번 지문은 평이하지만 첫번째 지문보다는 약간 더 길고 형식적인 문장을 사용해 보았다.
네이버가 전치사를 about을 쓰지 않고 of를 쓰긴 했지만 의미는 동일하다고 본다.
번역품질은 거의 완벽에 가까웠다.
반면에 구글은 article이란 단어를 사용했는데 article이 주는 뉘앙스는 메모나 공지사항을 전달할때 사용하기보다는 주로 토픽이 담긴 기사나 구체적이고 기술적인 주제를 놓고 쓰는 보고서형태의 글을 지칭할때 주로 쓰는 단어라서 뉘앙스적인 면에서 약간 부자연스럽다는 인상을 받는다.
빙의 번역도 이번에는 나쁘지 않았다라는점에서 조금은 고무적이다.



4. 나는 세달마다 우리 조부모님을 방문해요.
(I visit my grandparents every three months.)

N : I visit my grandparents every three months.

G : I visit my grandparents every three months.

B : I have a three month visit our grandparents.

S : We will visit the grandparents three months.

T : I every Se-dal visit our trillion parents.

R : 이번 지문은 평범해 보이지만 three months란 복수형태의 기간을 단수형태와 조합해서 쓰는 every와 같이 사용해야 하는 어찌보면 까다로운 지문이다.
네이버와 구글은 추천지문과 완벽하게 일치했고 빙은 '방문을 한다'라는 표현으로 'have'를 사용했다. 
하지만 visit과 grandparents사이에 to가 없어서 약간 어색해 보인다.



5. 나는 그런질문 자주 받아요.
(I often get asked that.)

N : I often ask that question.

G : I often ask that question.

B : I often get such questions

S : I don't often get such questions.

T : I face that question frequently

R : 이번 지문은 짧지만 수동태로 쓰이는 문장이라서 영문으로 번역하는것이 쉬운 형태는 아니다.
보통 get이란 단어를 차용하기가 쉽지가 않다.
그런면에서 보면 역시 자동번역기도 쉽지가 않나보다.
사람이 어려우면 자동번역기도 어려운건가?
이번엔 네이버와 구글 모두 수동형으로 번역하지 않고 능동형으로 번역했다.
'나는 그런 질문 자주해요!'라고 완전히 오역한것이다.
놀랍게도 이번엔 빙이 완벽에 가깝게 번역을 하였다.
시스트란의 번역도 오히려 나쁘다라고 말할수 없다.
한층 더 의외의 결과였다.



6. 당신을 화이트 부부의 30주년 결혼기념행사에 초대합니다.
(You are invited to Mr and Mrs white's 30th wedding anversary.)

N : I invite you to celebrate the 30th anniversary of the White House.

G : I invite you to the White couple's 30th wedding anniversary.

B : The 30th anniversary of the marriage of a couple of white you are invited to a celebration.

S : The couple's 30th anniversary celebration of white you married.

T : Invites you to 30 anniversary marriage commemorative events of the white couple.

R : 5번 지문은 국문으로나 영문으로나 수동형이 명백하지만 본 지문은 국문은 능동형이지만 영문은 주로 수동형으로 쓰인다는 점에서 좀 더 어려운 지문이다.
한국에선 '당신을 초대합니다'라고 표현하지만 영미권에선 '당신이 초대됩니다'라고 표현하는게 좀 더 자연스럽기 때문이다.
네이버의 번역물을 보면 이번에도 완전히 능동형으로 번역하였고 화이트부부를 'White House'로 오역한 점이 확인된다.
구글의 경우는 한국사람의 관점에서는 완벽해 보이지만 역시 능동형으로 쓰여졌기 때문에 영미권사람의 눈으로 볼때는 약간 어색하다.
오히려 빙의 번역물이 좀 더 완벽에 가까운게 인상적이다.
빙의 번역물이 나쁘지만은 않다라는것을 확인시켜주는 지문이다.



7. 그녀는 그러한 범죄들을 저지를만한 하등한 이유가 전혀 없었습니다.
(She had no reason to commit for those crimes.)

N : She had no reason to commit such crimes.

G : She had no reason to commit such crimes.

B : She might commit such crimes had no reason.

S : She had no reason to commit such a crime.

T : She will commit such crimes any reason there was not.

R : 네이버와 구글의 번역물이 일치한다는 점에서 인상적이다.
둘다 '그러한 범죄들'의 표현을 'such'란 단어를 차용하였다.
의미전달면에선 큰 손색은 없지만 완벽한 뉘앙스를 전달한다는 점에선 약간 부족하다.
'그러한 범죄들'에서 those란 단어를 차용하는것이 쉬운일이 아니란 점에서 역시 자동번역기의 한계가 느껴진다.
오히려 빙의 번역물의 품질이 이번에는 네이버나 구글보다는 더 나아보인다.
다음지문에서는 those가 어떤 뉘앙스로 쓰이는지를 자동번역기가 정말로 이해하고 있는지 확인해 보기로 하였다.



8. Just one of those things.
(그저 어쩔수 없는 일들중 하나.)

N : 어쩔 수 없는 일이었어요.

G : 그 중 하나만

B : 그런것 들 중 하나

S : 운이

T : 그것의 다만 1개

R : Those의 뉘앙스를 알고 있는가를 테스트하기 위해 이번엔 영한번역이 아니라 한영번역을 이용해 보았다.
정말 놀랍게도 Those의 뉘앙스를 알고 있는 번역기가 딱 한개 있었다.
네이버였다.
비록 완벽하지는 않다 하더라도 거의 90%에 가깝게 뉘앙스전달이 된 것이다.
한영 번역기품질에서는 구글이 압도적으로 월등할거라고 생각했던 나의 예상이 완전히 빗나가는 순간이었다.



9. 인간은 계획하고 신은 처리하신다.
(Human propose, God dispose.)

N : Man proposes, God disposes.

G : Man is planning and God is dealing.

B : Ma plans and God to handle.

S : Human beings are planning and God is processing.

T : The human being plans, puts on, controls

R : 이번 지문에서는 평범한 문장이 아닌 속담을 사용해 보았다.
속담은 아주 짧지만 그안에 강렬한 삶의 지혜가 담겨 있고 보통 음악적인 운율이 은밀하게 포함되어 있다.
예를 들면 '적게 먹고 적게 말하면 해가 없다'(Eating little and speaking little never do harm)라는 표현을 보자.
문장안에 운율이 흐르는게 보이는가?
이번 지문도 마찬가지이다.
이렇게 오래된 속담같은 지문은 데이터만 존재하면 문장자체를 통째로 차용하면 그만이니 오히려 번역이 쉬울수도 있겠다 싶은 생각이 들었다.
역시나 네이버는 데이터를 그대로 채용한것 같은 느낌이 들었다.
추천지문과 완벽하게 일치했다.
영문을 소리나는대로 읽으면 '맨 프로포즈~, 갓 디스포즈~'
시적인 문장이 아닐수 없다.



10. 나는 어느쪽이라고 단정할 수 없다.
(I can not commit myself either way.)

N : I can not conclude that I am either

G : I can not conclude either.

B : I can't assume that because either.

S : Which I did not.

T : I as which will not be able to conclude.

R : 이번엔 구글과 네이버 모두 단정짓다란 표현으로 'Conclude'란 단어를 채용했다.
뭔지 모르는 일에 대해 마음속으로 옳다고 판단한다라는 뉘앙스보다는 앞으로 진행될 일에 대한 결론을 내는듯한 뉘앙스의 단어이다.
아마도 자동번역기가 이것마저도 제대로 표현한다면 사람이 할일은 먹고 자고 즐기는 것 외에는 없지않을까?
이부분까지는 아직까지 자동번역기가 제대로 표현하지 못한다는 점은 오히려 위안으로 삼아야 할 일 같다.
여기서 또 하나 주목할 점은 빙의 경우 가정한다라는 의미의 'assume'이란 단어를 채용했다라는 점이다.
오히려 'can not commit myself' 와 가장 유사도가 높은 단어가 아닌가라고 생각된다.



한영번역에서 번역품질이 영한번역에서와는 달리 구글이 압도적으로 앞설 거라고 생각했던 나의 예상은 완전히 빗나갔다.
오히려, 네이버의 번역품질이 구글보다 월등하게 좋았다.
다시 생각해보면 아무리 구글이 검색로봇의 진화로 인한 언어처리의 최강자라고 하더라도 한국어의 처리에 있어서는 국내업체를 따라가지 못하는게 아닌가란 추측도 가능하다.
다른 한편으론 '플리토'같은 가장 인기가 있는 글로벌번역서비스의 헤드오피스가 국내에 위치해 있고 네이버가 이들의 데이터를 구매해서 차용하고 있기 때문이 아닌가란 가능성도 엿보인다.
여튼 결과적으로 내 예상과는 달리 한영이든 영한이든 한국어에 관한 자동번역은 네이버가 최고다.
한편으로 의외의 결과로는 마이크로소프트의 '빙'도 생각보다 나쁘지 않다라는 점이다.
특히 영한번역보다는 한영번역에 있어서 그 느낌이 강했는데 이는 지문을 더 늘려가면서 확인해야 할 듯 싶다.
다른 언어의 번역에 있어서는 당연히 구글일 것이다.
그렇다면, 중국 검색시장의 최강자인 '바이두'도 네이버와 같은 맥락일 것을 추측해 볼 수 있다.


댓글

이 블로그의 인기 게시물

쇼피파이 (SHOPIFY)의 장점과 단점

무역창업의 길을 나서면 몇갈래 길이 있을까?

미래전망이 가장 좋은나라 TOP2 - 인도, 필리핀