영한 자동번역기 네이버 vs 구글
글로벌 비지니스를 진행하는데 있어 아무래도 가장 큰 어려움은 언어의 장벽이 아닐까 생각된다.
시장을 개척할때 해당국가의 현지인의 마음을 사로잡기 위해서는 그저 소통가능한 언어정도로는 어림도 없을것이다.
하지만, 이러한 언어의 장벽이 점차 허물어져가고 있다.
자동번역기의 성능이 인공지능의 도입으로 인해 날로 발전하고 있기 때문이다.
아직 초기라고는 하지만 평범한 수준의 언어소통은 이제 무리가 아닐정도이다.
현 상황에서 어떤 번역기가 그나마 낳은 수준인지 직접 테스트를 해 보았다.
사용한 자동번역기는
1. 네이버 번역기 (http://translate.naver.com/#/en/ko)
2. 구글 번역기 (https://translate.google.co.kr/)
3. 빙 번역기 (http://www.bing.com/translator/)
4. SDL (https://www.freetranslation.com/)
5. SYSTRAN (http://www.systranet.com/translate/)
이렇게 총 5개를 사용해 보았다.
우선 영한번역을 시도해 보았다.
중등학교 수준의 평범한 문장부터 의역이 필요한 문장까지 난이도를 높혀가며 번역을 시도해 보았다.
N : 네이버번역기
저 나무 손질 좀 해 주시겠어요?
G : 구글번역기
그 나무를 다듬을 수 있니?
B : 빙번역기
당신은 그 나무 트림 줄 수 있습니까?
S : SDL
이러한 트리를 트림 제공하는가?
T : SYSTRAN
당신은 그 나무에게 손질을 줄 수 있는가?
R : 비교결과
문장 자체가 아주 평범하고 난이도가 쉬운 문장이지만 부자연스러운 번역의 수가 더 많은걸 확인할 수 있다.
게중에 네이버번역기가 가장 자연스러운 번역이었다.
구글과 시스트란이 오역이 없는편이었지만 단순 직역에 가까워서 약간 부자연스럽다.
N : 나는 그곳에서 단골손님이다.
G : 나는 거기에 있는 일반고객이다.
B : 나는 거기에 단골손님입니다.
S : 저는 단골손님이 있다.
T : 나는 거기 단골손님 있다.
R : 이번에도 네이버가 가장 자연스러웠고 빙번역기도 비슷하게 번역했다.
반면 구글은 직역에 충실한 나머지 의미가 다른 번역문을 내놓았다.
N : 신뢰가 없다면 우정이 있을수 없기 때문입니다.
G : 이것은 신뢰가 없는 우정이 없기 때문이다.
B : 신뢰가 없는 우정이 있을수 없기 때문입니다.
S : 이 믿음이 없는 우정은 없다고 할 것이기 때문이다.
T : 이것은 신뢰없이 아무 친교도 있기 수 없기 때문이다.
R : 평이하지만 약간 더 긴 문장을 사용해 보았다.
전반적으로 모든 번역기가 앞선 문장보다 더 자연스럽게 번역을 하였지만 네이버가 가장 자연스러운 번역에 가까웠고 구글과 빙은 직역에 가까웠다.
SDL과 시스트란도 이번엔 오역이라고 말하기엔 어려운 번역품질을 보여주었다.
N : 내가 어젯밤에 파티에 갔더라면, 나는 많은 사람들을 만났었을텐데.
G : 어젯밤에 파티에 간다면 나는 많은 사람들을 만났을거야.
B : 만약 내가 어젯밤 파티에 갔 었 다, 난 사람들을 많이 만난 것.
S : 어젯밤 파티 돌아간 많은 사람들이 직장을 만나지 못했을텐데.
T : 나가 당에 지난 밤에 간 경우에, 나는 많은 사람들을 만났을 것입니다.
R : 이번에도 평이한 문장이지만 첫번째, 두번째보단 좀 더 긴 문장을 사용해 보았다.
이번에도 네이버가 가장 완벽한 번역품질을 보여주었고 의외로 구글은 어젯밤에 파티에 간다면이라는 다소 오역에 가까운 번역문이 나왔다.
빙과 SDL은 정말 기계스럽다는 느낌이 다분히 들고 시스트란의 경우는 파티를 당이라고 표현하고 내가를 나가라는 다소 우스운 방법으로 표현했다.
마치 기계가 사투리를 쓰는듯한 느낌이 들어 살짝 웃음이 나왔다.
N : 귀사와 직접 접촉할 수 있는 회사에 이메일을 보냈습니다.
G : 나는 당신에게 직접 연락할 것입니다. 다음과 같은 회사에 귀하의 이메일을 전달했습니다.
B : 저는 fowarded 직접 연락을 것입니다 다음회사에 귀하의 이메일.
S : 내가 직접 연락을 취할 수 있는 다음 회사에서 귀하의 메일로 fowarded.
T : 나는 당신에게 직접 연락할 뒤에 오는 회사에게 당신의 이메일을 fowarded.
R : 이번에는 난이도를 조금 더 높혀서 약간 복잡하고 사무적인 어투의 문장을 사용하여 보았다. 이번에도 네이버가 가장 모범번역에 가까운 의역을 내놓았다. 구글은 직역의 결과가 약간은 자연스럽지가 않다.
반면 나머지 번역기들은 fowarded란 단어에 대한 데이터가 없는지 원문 그대로를 노출시켰다.
N : 그것은 나에게 공정거래를 의미할 것이다.
G : 그것은 나에게 많은것을 의미할 것입니다.
B : 창 살을 의미할 것입니다 그것은 나에 게.
S : 나한텐 그런 격자로 거래를 의미한다.
T : 그것은 저에게 거슬리는 소리 거래를 의미할 것입니다.
R : 이번 문장은 관용어구를 써 보았다. 의역하지 않고 있는 그대로 직역한다면 네이버의 결과의 번역문을 내놓게 되는 것이다.
이번엔 놀랍게도 구글번역이 가장 자연스러웠다.
외국번역기가 처음으로 현지로컬번역기를 이긴것이다.
나머지 번역기는 완전히 오역이었다.
N : 나는 쏟아진 우유에 울고 싶다.
G : 유출된 우유에 대해 울고 싶지 않았습니다.
B : 내가 didn't 엎지른된 우유 위로 울고 싶어.
S : 내가 'nt기업분할 우유를 보며 우는 것을 원치 않습니다.
T : 내가 'nt 기업분할 우유를 보며 우는 것을 원치 않습니다.
R : 이번문장은 번역하기 가장 어려울법한 관용어구를 써 보았다.
영어로는 지나간일에 대해 엎지른 우유라고 표현하고 한국어론 우유대신 물을 쓰는 점만 다르다.
비록 관용어구에서 사용하는 단어가 서로 다를지언정 이렇게 비슷한 의미도 있을 수 있다라는 점이 참 재미있다.
더 흥미로운 점은 이 문장에선 어떤 번역기도 제대로 된 품질의 번역을 보여주지 못했다라는 점이다.
아마도. 시간이 더 흘러서 인공번역의 학습량이 더 쌓이면 3번과 같은 무난한 품질의 번역문을 보여주지 않을까라고 생각된다.
영한번역에서는 자동번역은 아무래도 국내번역기인 네이버번역기가 조금 더 우세하게 번역품질이 더 좋았다.
그 다음으로 구글번역기의 번역품질도 나쁘지는 않았지만 대체적으로 의역보다는 직역에 가까웠다.
나머지 빙이나 SDL, 시스트란의 경우 번역품질은 실망스러웠던 편이었다.
한영번역에선 어떤 결과가 나올지 기대된다.
아무래도 구글의 번역품질이 더 뛰어나지 않을까란 섣부른 예상이 드는데...
과연 어떨까?
시장을 개척할때 해당국가의 현지인의 마음을 사로잡기 위해서는 그저 소통가능한 언어정도로는 어림도 없을것이다.
하지만, 이러한 언어의 장벽이 점차 허물어져가고 있다.
자동번역기의 성능이 인공지능의 도입으로 인해 날로 발전하고 있기 때문이다.
아직 초기라고는 하지만 평범한 수준의 언어소통은 이제 무리가 아닐정도이다.
현 상황에서 어떤 번역기가 그나마 낳은 수준인지 직접 테스트를 해 보았다.
사용한 자동번역기는
1. 네이버 번역기 (http://translate.naver.com/#/en/ko)
2. 구글 번역기 (https://translate.google.co.kr/)
3. 빙 번역기 (http://www.bing.com/translator/)
4. SDL (https://www.freetranslation.com/)
5. SYSTRAN (http://www.systranet.com/translate/)
이렇게 총 5개를 사용해 보았다.
우선 영한번역을 시도해 보았다.
중등학교 수준의 평범한 문장부터 의역이 필요한 문장까지 난이도를 높혀가며 번역을 시도해 보았다.
영한번역 사례
1. Can you give that tree a trim? (저 나무 손질 좀 해 주시겠어요?)
저 나무 손질 좀 해 주시겠어요?
G : 구글번역기
그 나무를 다듬을 수 있니?
B : 빙번역기
당신은 그 나무 트림 줄 수 있습니까?
S : SDL
이러한 트리를 트림 제공하는가?
T : SYSTRAN
당신은 그 나무에게 손질을 줄 수 있는가?
R : 비교결과
문장 자체가 아주 평범하고 난이도가 쉬운 문장이지만 부자연스러운 번역의 수가 더 많은걸 확인할 수 있다.
게중에 네이버번역기가 가장 자연스러운 번역이었다.
구글과 시스트란이 오역이 없는편이었지만 단순 직역에 가까워서 약간 부자연스럽다.
2. I am a regular customer there. (나는 그곳 단골이야)
N : 나는 그곳에서 단골손님이다.
G : 나는 거기에 있는 일반고객이다.
B : 나는 거기에 단골손님입니다.
S : 저는 단골손님이 있다.
T : 나는 거기 단골손님 있다.
R : 이번에도 네이버가 가장 자연스러웠고 빙번역기도 비슷하게 번역했다.
반면 구글은 직역에 충실한 나머지 의미가 다른 번역문을 내놓았다.
3. This is because there can't be no friendship without trust.
(신뢰가 없다면 우정이 있을 수 없기 때문입니다.)
N : 신뢰가 없다면 우정이 있을수 없기 때문입니다.
G : 이것은 신뢰가 없는 우정이 없기 때문이다.
B : 신뢰가 없는 우정이 있을수 없기 때문입니다.
S : 이 믿음이 없는 우정은 없다고 할 것이기 때문이다.
T : 이것은 신뢰없이 아무 친교도 있기 수 없기 때문이다.
R : 평이하지만 약간 더 긴 문장을 사용해 보았다.
전반적으로 모든 번역기가 앞선 문장보다 더 자연스럽게 번역을 하였지만 네이버가 가장 자연스러운 번역에 가까웠고 구글과 빙은 직역에 가까웠다.
SDL과 시스트란도 이번엔 오역이라고 말하기엔 어려운 번역품질을 보여주었다.
4. If I had gone to the party last night, I would have met a lot of people.
(내가 어젯밤에 파티에 나갔더라면 많은 사람들을 만났을텐데)
N : 내가 어젯밤에 파티에 갔더라면, 나는 많은 사람들을 만났었을텐데.
G : 어젯밤에 파티에 간다면 나는 많은 사람들을 만났을거야.
B : 만약 내가 어젯밤 파티에 갔 었 다, 난 사람들을 많이 만난 것.
S : 어젯밤 파티 돌아간 많은 사람들이 직장을 만나지 못했을텐데.
T : 나가 당에 지난 밤에 간 경우에, 나는 많은 사람들을 만났을 것입니다.
R : 이번에도 평이한 문장이지만 첫번째, 두번째보단 좀 더 긴 문장을 사용해 보았다.
이번에도 네이버가 가장 완벽한 번역품질을 보여주었고 의외로 구글은 어젯밤에 파티에 간다면이라는 다소 오역에 가까운 번역문이 나왔다.
빙과 SDL은 정말 기계스럽다는 느낌이 다분히 들고 시스트란의 경우는 파티를 당이라고 표현하고 내가를 나가라는 다소 우스운 방법으로 표현했다.
마치 기계가 사투리를 쓰는듯한 느낌이 들어 살짝 웃음이 나왔다.
5. I have fowarded your email to the following companies that will contact you directly.
(귀하의 이메일을 당신이 직접 접촉할 다음의 회사들에게 전달하였습니다.)
N : 귀사와 직접 접촉할 수 있는 회사에 이메일을 보냈습니다.
G : 나는 당신에게 직접 연락할 것입니다. 다음과 같은 회사에 귀하의 이메일을 전달했습니다.
B : 저는 fowarded 직접 연락을 것입니다 다음회사에 귀하의 이메일.
S : 내가 직접 연락을 취할 수 있는 다음 회사에서 귀하의 메일로 fowarded.
T : 나는 당신에게 직접 연락할 뒤에 오는 회사에게 당신의 이메일을 fowarded.
R : 이번에는 난이도를 조금 더 높혀서 약간 복잡하고 사무적인 어투의 문장을 사용하여 보았다. 이번에도 네이버가 가장 모범번역에 가까운 의역을 내놓았다. 구글은 직역의 결과가 약간은 자연스럽지가 않다.
반면 나머지 번역기들은 fowarded란 단어에 대한 데이터가 없는지 원문 그대로를 노출시켰다.
6. It would mean a grate deal to me. (저로서는 큰 의미가 되겠습니다.)
G : 그것은 나에게 많은것을 의미할 것입니다.
B : 창 살을 의미할 것입니다 그것은 나에 게.
S : 나한텐 그런 격자로 거래를 의미한다.
T : 그것은 저에게 거슬리는 소리 거래를 의미할 것입니다.
R : 이번 문장은 관용어구를 써 보았다. 의역하지 않고 있는 그대로 직역한다면 네이버의 결과의 번역문을 내놓게 되는 것이다.
이번엔 놀랍게도 구글번역이 가장 자연스러웠다.
외국번역기가 처음으로 현지로컬번역기를 이긴것이다.
나머지 번역기는 완전히 오역이었다.
7. I did'nt want to cry over spilt milk.
(엎지른 물을 두고 한탄하고 싶지는 않았습니다.)
G : 유출된 우유에 대해 울고 싶지 않았습니다.
B : 내가 didn't 엎지른된 우유 위로 울고 싶어.
S : 내가 'nt기업분할 우유를 보며 우는 것을 원치 않습니다.
T : 내가 'nt 기업분할 우유를 보며 우는 것을 원치 않습니다.
R : 이번문장은 번역하기 가장 어려울법한 관용어구를 써 보았다.
영어로는 지나간일에 대해 엎지른 우유라고 표현하고 한국어론 우유대신 물을 쓰는 점만 다르다.
비록 관용어구에서 사용하는 단어가 서로 다를지언정 이렇게 비슷한 의미도 있을 수 있다라는 점이 참 재미있다.
더 흥미로운 점은 이 문장에선 어떤 번역기도 제대로 된 품질의 번역을 보여주지 못했다라는 점이다.
아마도. 시간이 더 흘러서 인공번역의 학습량이 더 쌓이면 3번과 같은 무난한 품질의 번역문을 보여주지 않을까라고 생각된다.
영한번역에서는 자동번역은 아무래도 국내번역기인 네이버번역기가 조금 더 우세하게 번역품질이 더 좋았다.
그 다음으로 구글번역기의 번역품질도 나쁘지는 않았지만 대체적으로 의역보다는 직역에 가까웠다.
나머지 빙이나 SDL, 시스트란의 경우 번역품질은 실망스러웠던 편이었다.
한영번역에선 어떤 결과가 나올지 기대된다.
아무래도 구글의 번역품질이 더 뛰어나지 않을까란 섣부른 예상이 드는데...
과연 어떨까?
댓글
댓글 쓰기