グローバル引きこもり的ブログ

「Common Lispと関数型プログラミングの基礎」というプログラミングの本を書いてます。他に「引きこもりが教える! 自由に生きるための英語学習法」という英語学習の本も書いています。メール → acc4297gアットマークgmail.com

Google翻訳の和文英訳は今の段階でどれくらい使えるか?

以前、Google翻訳で英文を翻訳したらどんな感じの日本語になるのかを紹介した。翻訳の結果を見る限り、機械翻訳のテクノロジーが大きく進歩している事はわかったけれども個人的にはまだまだだな、と感じた。翻訳プログラムというからには最低限これくらいの事はできないとね、という所までやっと来たか、というのが正直な印象で、翻訳プログラムとして評価するならばべつに驚くほどの事でもないかな、と思った。

それはそうとして、前回は英文を日本語に翻訳する場合だったが、それではGoogle翻訳で日本語を英語に翻訳してみたらどうであろうか?と思って試してみた。データは前回と同じくウィキペディアヒラリー・クリントンの項目から採用する。

1947年、イリノイ州シカゴに衣料品店を営む両親のもとに生まれた。

 

Born in 1947, parents who run clothing stores in Chicago, Illinois.

いきなり誤訳というか、英文として意味不明である。主語を省略すると対応できないようだ。日本語では主語を明示されない事が多いので、これはまずい。

一家はメソジスト教派であり、彼女は白人中産階級が多く住むイリノイ州パークリッジで成長する。

 

Families are Methodist denominations, and she grows at Park Ridge, Illinois, where many white middle classes live.

過去の出来事であるという事が認識できていない。Families are Methodist denominationsというのは意味は通じるがもう少しなんとかならないものか?ここはFamilies are MethodistかFamilies belong to the Methodist churchでよいところだ。

父親のヒュー・ローダムは保守主義者であり、繊維業界の大物であった。

 

Father Hugh Rodham was a conservative and a big person in the textile industry.

a big personの不定冠詞は無い方がいい。 person in the textile industryというのは自然な訳だが、a big personという訳はちょっと口語的すぎるような気がする。

母親のドロシーは専業主婦であり、ドロシーの両親はドロシーが幼い頃離婚、ドロシーは父方の両親に預けられ寂しい子供時代を過ごした。

 

Dorothy of the mother is a full-time housewife, and Dorothy's parents divorced when Dorothy was young, and Dorothy was deposited with his paternal parents and spent a lonely childhood.

いきなりDorotdhy of the motherという日本人みたいな英語が出てきて笑った。それから「ドロシーは父方の両親に預けられ」という所が「ドロシーは貯金され」というように翻訳されている。spent a lonely childhoodという訳はよい(というか元の日本語もおかしいね。それからヒラリーの性格的欠陥はこの母親に由来からも来ているのではないか、というのが暗示されていて興味深い)

ヒラリーには二人の弟、ヒューとトニーがいる。

 

Hillary has two brothers, Hugh and Tony.

 これは正しい。

ヒラリーは幼少時からスポーツに興味を持ち、テニスやスケート、バレーボールなどを楽しんだ。

 

Hillary was interested in sports since childhood, enjoying tennis, skating, volleyball and so on.

 これも翻訳としてはいいと思う。

また早くから政治に興味を持ち、若き共和党員として活動、1964年の大統領選では共和党のバリー・ゴールドウォーター候補を応援するゴールドウォーターガールを務めた。


He also got interested in politics earlier and acted as a young Republican, and in the 1964 presidential election he served as a gold water girl to support Republican Barry Goldwater candidates.

前後の文脈を読んでおらず、主語が省略されると対応できていない。そのためにhe served as a gold water girlという、なんのLGBTだよ?みたいな英語が出てくる。interested in politics earlierというのも、意味は通じるが変。support Republican Barry Goldwater candidatesというのもなんでこうなるのか良く分からない英語である。正しくはsupport Republican candidate Barry Goldwaterとなる。gold water girlは間違い。Goldwater girlという固有名詞がある。

メイン東高校を卒業後、1965年にマサチューセッツ州の名門女子大であるウェルズリー大学に入学、1年生の時、学内青年共和党の党首に選ばれるが、ベトナム戦争公民権に関する共和党の政策に疑問を持ち始め、その後辞任。

 

After graduating from the main east high school, he entered Wellesley College, a prestigious women's college in Massachusetts in 1965, and when he is a freshman, he is elected to be the leader of the campus Youth Republican Party, but raises doubts about Republican policies on Vietnam War and civil rights I started holding and then resigned.

前半はsheとなるべき所がheになっている以外はよい。but raises doubts about Republican policies on Vietnam War and civil rights I started holding and then resignedはぎりぎり英語として意味が通じるが、heが主語のところに勝手に'I'を追加している。普通に書けばbecame sceptical about Republican policies, and resignedという感じだろうか。

1968年の大統領予備選では、ベトナム戦争介入反対を掲げる民主党のユージーン・マッカーシー候補を支持した。

 

In the presidential preliminary election in 1968, he supported Democratic Party Eugene McCarthy's candidate who opposes the Vietnam war intervention.

 「 民主党のユージーン・マッカーシー候補」がどうして訳せないんだろ?

その一方で、同年の夏には首都ワシントンの下院共和党議員総会でインターンを経験、共和党党大会ではニューヨーク州知事ネルソン・ロックフェラーのために働いた。

 

On the other hand, during the summer of the same year I worked internship at the Republican House of Representatives in Washington, the capital, for the Republican Party Congress for the New York State Governor Nelson Rockefeller.

下院共和党議員総会と共和党党大会という関係のない2つを勝手に関連づけており、意味不明な訳文になっている。

その後ウェルズリー校を優秀な成績で卒業、同大学初の卒業生総代として行ったスピーチが賞賛から非難までさまざまな反響を呼び、地元のテレビ局のインタビューに出演、『ライフ』誌にも取り上げられた。

 

After graduating from Wellesley School with excellent results, a speech that went on as a college's first graduate companion called various reactions from praise to accusation, appeared in an interview with a local TV station, and was also featured in "Life" magazine.

元の日本語がおかしいのによく訳せていると思う。various reactions from praise to accusationとか、also featured in "Life" magazineというのはうまい訳だと思う。

感想

そもそもにして元の日本語からして無茶苦茶なのであれなのだが、翻訳結果を見てみるとやはり厳しいかな、という感じがする。正直この結果からは機械学習による手法が本当に万能なのか、本当にすべての困難を解決できるのかは分からない。

とはいえ技術というのはこれまで常に人間の想像を超えてきたわけなので、プログラムで完全な翻訳ができるようになるだろうという予測をすることは間違いではない。しかし、結果を見ると、個人的には楽観できないかな、という気がする。

その一方で、上の例でみるようにGoogle翻訳が英語のかなりの部分をある程度の正確さで翻訳できるというのも事実だ。

それから、これは意外だったのだが機械翻訳の世界では英文和訳と和文英訳ではそれほど翻訳精度に違いはないようにも感じる。翻訳精度の差は案外学習データの量の違いなのかもしれないが(英訳された日本語よりも英語の翻訳のほうが量が圧倒的に多いから)、英文和訳よりも和文英訳のほうが難しいんだろうと思っていたのでこれは意外だった。

いずれにせよ、機械翻訳の世界ではまだやるべき事が山ほどあるはずなので、これからも機械翻訳には注目していきたい。