重ね描き日記(rmaruy_blogあらため)

読書メモ、探究メモなど。

新刊紹介:機械翻訳(ティエリー・ポイボー著、高橋聡 訳、中澤敏明 解説)…機械翻訳の実像を捉える、ユーザーのための一冊

筆者が企画・編集で携わった翻訳書、『機械翻訳:歴史・技術・産業』の紹介記事です。同書は2020年9月29日前後の発売予定です。

機械翻訳:歴史・技術・産業

機械翻訳:歴史・技術・産業

 

機械翻訳」――今、この言葉を聞くと、何かを語りたくなる方が多いのではないでしょうか。2020年現在、機械翻訳に関する注目は高いように感じます。

一方には、「機械翻訳で世界は変わる!」といったトーンの期待感があります。「みらい翻訳」や「DeepL」など、次々と新しい機械翻訳システムが公開される昨今、その目覚ましい精度向上を受け、「もはや外国語の学習が不要になるのではないか」とか、「学問における、言語によるハンデが消滅するのではないか」といった意見も見られます。

他方では、今の機械翻訳の限界や、それに頼る危険性を強調する人もいます。機械翻訳が、人間なら決してしないようなミスをおかすことや、それが災害情報などで実害を及ぼしたケースが話題となったりもしました*1

機械翻訳システムが出してくれる結果のうち、「びっくりするほど滑らかな翻訳」と「目を疑うような誤訳」のどちらに着目するかによって、機械翻訳を革命的な技術とみなすか、取るに足らない(場合によっては有害な)技術とみなすかが分かれるようです。しかしいずれにしても、機械翻訳を「言語Aを言語Bに変えてくれる魔法のブラックボックス」と捉えるために生じる極端な見方ではないでしょうか。実像は、過度な期待と過度な軽視の中間にあるはず。やはり、機械翻訳を「使う」立場の私たちも、ある程度その技術の「中身」を知っておく必要があるように思えます。

ティエリー・ポイボー著『機械翻訳:歴史・技術・産業』(原題:Machine Translation)は、それに適した書籍となっています。原書はMIT Pressの「Essential Knowledge Series」の一冊で、機械翻訳の研究の黎明期から説き起こし、現地点までの発展をコンパクトにまとめています。著者は自然言語処理の専門家ですが、テクニカルな説明は最小限にとどめ、産業や学問としての機械翻訳の歴史の記述にもページを割いているのが特徴です。

目次は以下の通りです。 

第1章 はじめに
第2章 翻訳をめぐる諸問題
第3章 機械翻訳の歴史の概要
第4章 コンピューター登場以前
第5章 機械翻訳のはじまり:初期のルールベース翻訳
第6章 1966年のALPACレポートと、その影響
第7章 パラレルコーパスと文アラインメント
第8章 用例ベースの機械翻訳
第9章 統計的機械翻訳と単語アラインメント
第10章 セグメントベースの機械翻訳
第11章 統計的機械翻訳の課題と限界
第12章 ディープラーニングによる機械翻訳
第13章 機械翻訳の評価
第14章 産業としての機械翻訳:商用製品から無料サービスまで
第15章 結論として:機械翻訳の未来

解説:2020年時点でのニューラル機械翻訳(中澤敏明:東京大学特任講師)

一読者として、筆者が得た学びをあげるとしたら下記2点があります。

  1. 機械翻訳の研究開発は、その「産業」と切り離せない
  2. 統計的機械翻訳(SMT)とニューラル機械翻訳(NMT)は仕組みがまったく異なる

(1)機械翻訳は、アルゴリズム開発などの技術面だけでなく、いかに「対訳コーパス」作成に労力がかけられるかといった、技術以外の要素も大きくかかわります。そのため、国家や企業などの各プレーヤーがどのような経済的メリットを期待して開発にコストをかけるかが、分野としての進展を左右してきた歴史があることが、本書を読むとわかります。この「産業」とそれを支えるプレーヤーという視点は、今後の進展を見通すうえでも重要なのではないかと思えました。

(2)近年の機械翻訳の精度向上は、深層ニューラルネットワークを用いた「ニューラル機械翻訳(NMT)」の登場でもたらされたと言われます。それ以前の機械翻訳のメインストリームは「統計的機械翻訳(SMT)」と呼ばれるものですが、本書を読む前は、NMTはSMTをニューラルネットワークで実装したようなものだろうと素人ながら想像していました。が、NMTはそもそもSMTと翻訳に関する発想が異なっており、そのため両者の得意・不得意(エラーの傾向)も異なることを知りました。この点は、ユーザとしてもっておくべき知識のように思えました。

以上はあくまで私個人の印象に残った点であり、本書が扱うトピックのごく一部に過ぎません。

さて、本書の日本語版の特徴として、機械翻訳のユーザーの代表ともいえる翻訳家と、技術の供給者である研究者の両方が携わっていることが挙げられます。訳者の高橋聡さんは日本翻訳連盟の副会長で、機械翻訳との付き合い方を模索しつつある翻訳業界の中枢にいる方。一方、解説者の中澤敏明先生は、機械翻訳の日本屈指の研究者として、その技術の啓発活動にも力を入れている方です。本書には「訳者あとがき」と「解説」が収められていますが、それぞれにリアリスティックな機械翻訳像が描かれています。

高橋聡さんの「あとがき」は下記リンクから読むことができます。

機械翻訳がもう少し進化すれば、外国語は学ばなくてよくなるという楽観論は、たぶん間違いでしょう。かといって、「機械翻訳なんて、海外旅行が便利になるくらいのものでしょ?」という過小評価も同様に誤っている。機械翻訳はあくまで「ツール」にとどまるが、しかしそれを使わない・使えないことが著しいハンデになるような、そんな世界が想像されます。本書が、機械翻訳がもたらす未来についてよりリアリスティックな展望をもち、いちユーザーとして付き合い方を考えるきっかけになればと思います。

 

関連記事

機械翻訳が「言語」にもたらすインパクトを学術的に探究した『機械翻訳と未来技術』は非常に面白い本です。実は私がポイボー著のことを知ったのは、この中の瀬上和典先生の章で紹介されていたのがきっかけでした。この場を借りて、瀬上先生にお礼申し上げます。 

*1:今の機械翻訳技術に批判的な研究者の急先鋒の一人がダグラス・ホフスタッターだと思います。彼が2018年に行った機械翻訳(MT)批判の講演は、少々アンフェアでないかと思える点もありますし、また本記事の論旨から若干ずれますが、彼なりの深い言語観が感じられる、大変面白い講演です。筆者は大好きです。