How IT Works

プログラマーやっています。技術よりも人間学的なところが好きです。

ChatGPTを使って翻訳を補助する(2023年11月11日時点)

これ何

本業とはあまり関係がないんですが、趣味で中国武術の翻訳(中文=>日本語)をしています。二年ぐらい前にDeepLやGoogle Translateの力を借りながらやっている時期もあったんですが、翻訳に時間が割かれすぎて、練習の時間がなくなるという本末転倒の状態になりしばらく辞めていました。

最近ChatGPTが出てきたので試しにこれで翻訳の補助をさせると片手間でそれっぽい翻訳ができるようになったので、その方法を紹介します。

直接業務の役に立つ人はいない気はしますが、ChatGPTを使った業務改善ぐらいの温度感で読むといいと思います。ちなみにChatGPTは課金していて、GPT-4を使っています。言語能力に関してはGPT-4が断然優れていますし、最近出たGPTsを使った方が楽に作業ができます。

自分自身、ChatGPTを使って本格的に翻訳をする記事を探していたんですが、あまり引っかからなかったので記事にまとめます。

プロンプトエンジニアリング

最初はGPTsとかはなかったのでとりあえずプロンプトを工夫しました。

あまり細かくは書きませんが、翻訳業務を主にいくつかの段階に分かれます。

  • 事前作業(翻訳のための文章調整、背景情報の調査、スタイルガイドの作成)
  • 翻訳(単語の意味、構文の解釈、文章の工夫など)
  • 事後作業(翻訳の正確性、流暢性、スタイルガイドに合っているかなどの確認、ファイル形式の変換)

そのため、タスクごとにプロンプトを作って工程ごとに指示します。以下は翻訳のプロンプトの例です。実際の指示は全て英語にしています(トークン削減のため)。

これから中国語を書いて行くので、日本語に翻訳してください。

訳のルールは以下です。
- できるだけ直訳で訳す
- できるだけ単語をそのまま使用する 
- 中国武術の文章として訳す
- ですます調ではなく、だである調で翻訳する
- 翻訳の際は日本語の訳文のみ返答する
    
以下の表にある単語は下記の表に従って、訳してください。
| 中国語 | 日本語 |
|-----|-----|
| 站桩  | 站樁  |
| 推手  | 推手  |
| 散手  | 散手  |
| 技击  | 技撃  |
| 功夫  | 功夫  |
 
以下が翻訳の例です。今後翻訳する際は以下を参考にしてください。
 
(中国語)
我国拳学兴自战国时代,后以达摩洗髓易筋两法参之于华佗之五禽戏,始汇成斯技。虽今门派繁多,其渊源一也。不论如何分派,总不出以拳为名。夫拳者乃拳拳服膺之谓拳。动静处中,能守能用,此尽吾人气质本能之道,非纯式套数专论招法之所谓拳也。
 
(日本語)
我が国の拳学は戦国時代より興り、後に達磨の洗髄易筋の二法と華佗の五禽戲とを合わせて、その技を形成することとなった。今日、多数の門派が存在するも、その淵源は一つである。どのような派閥であれ、拳の名を外れることはない。拳とはいわゆる拳拳服膺の拳である。動静の中にあり、能く守り能く用いる。これが我々の気質や本能の道である。単に套路を数えて、専ら招法を論じる拳ではない。

このプロンプトと原文を渡すと大体80点ぐらいの訳が出てくるので、辞書やBardに不明な箇所を投げながら翻訳作業をしていました。BardはChatGPTと異なる解釈をしてくれることが多いので迷ったら両方に投げて比較します。

これも悪くはないんですが、単語表を増やしたり、原文が長くなるとあっという間にトークン切れになるのが難点でした。毎回プロンプトをコピーして新しいチャットを作るのは気持ち面倒でした。

GPTs

最近、GPTsが出たので上記の問題点が解決しないか試していました。最初は指示を聞いてくれなかったのですぐに諦めていましたが、下記の記事を参考に作ってみるとうまくいきました。

note.com

設定項目 内容
Name 中→日翻訳
Description help to translate Chinese into Japanese.
Instructions This GPT translates Chinese text into Japanese. The provided Chinese text includes content related to Chinese martial arts. To ensure minimal loss of the original meaning, GPT will respond as literally as possible, and translates using standard Japanese (in a plain form, 'da/de aru' style) without using polite language (the 'desu/masu' form).This GPT uses words as they are as much as possible.The basic rules of translation are indicated in prompt.txt, and these are followed. The user will present only in Chinese, and GPT will respond with only the Japanese translation.

最初はCreateタブで頑張って回答したり、ファイルをアップロードしてそこに指示を書いていましたが、上記記事を参考にInstructionsに指示を英訳して書くとうまく行きました。英語なのはその方が認識してくれやすい気がするからです。

手軽に作れたので、下記はおまけで作った翻訳補助です。わかりにくい文章を投げると、翻訳、単語の意味、構文の解釈を教えてくれるようにしています。便利ですが、こっちももう少し解釈が難しい時に工夫できそう。

設定項目 内容
Name 中→日翻訳補助
Description This GPT helps in converting Chinese text
Instructions This GPT helps in converting Chinese text, written about Chinese martial arts, into Japanese. This GPT responses in Japanese.Specifically, it provides a literal translation of the entire text, interpretation and explanation of the syntax, and the meanings of each word that make up the composition, thus assisting in accurately translating the Chinese language.

やってみた感じ、数千字を投げても翻訳を諦めないので、トークン数を気にせずに翻訳作業ができるようになりました。これでプロンプトをコピペする雑務からは逃れることができました。

ただ、prompt.txt というファイルに用語表を入れているんですが、これを時折無視している気がしていて、用語表の扱いはもうちょっと考える余地がありそうです。どちらにせよ手直しするので実際にはそこまで手間ではないんですが、エンジニアリングしたい気持ちがあります。

あとはこれらのGPTsを統合してスーパーGPTにできるのかもしれませんが、今のところやっていません。コンテキストが混ざると、自分自身が混乱する気もします。

総括

ChatGPTが出るまで翻訳作業は面倒で手に負えない感じだったんですが、技術の発展でだいぶ楽に作業できるようになりました。

個人的にトークン数を気にするのが本当に面倒で、APIを使ってバッチ処理しようかとも思ってたんですが、今のところGPTsのおかげでかなり快適に作業ができています。これ以上文章量を増やしてもチェックする手間が増えるだけだし、先生の真意を理解しようと思えば、翻訳より比較や解釈、議論などが必要なところだと思うので、量を求めてAPIに投げるのは趣味ではやらないと思います。先生方の文章をできる限り食べさせて、研究を深める方向ならやってみたいですね。

要望としてはChatGPTにファクトチェックとか情報収集を任せたいんですが、中国語の情報収集はほぼ0点なのでこの辺りはもうちょっとなんとかして欲しいし、いい方法を考え中です。先生を指定して論文を調べてもらうと大体間違っており、Bing検索をONにすると大体BOTが許可されていません。

なので、おそらく中国から本を輸入して自炊して食べさせるのが一番早そうですが、技術の発展を待ちつつ、工夫してみたいです。

最後に、翻訳作業を円滑にするためにはやはり翻訳業務や訳したい文章のコンテキストへの理解、日本語能力などが必要だなと思いました。80点を(自分なりの)100点に近づけるためにはその辺りのことを勉強する必要があり、求められるのはエンジニアリング能力だけではなかったです。まぁ、プログラミングもコーディングルールを決めて、コーディングをして、テストしてリファクタリングするので、似たような推論ができたのかもしれないですが。

ChatGPTを工夫していくとその辺りの業務理解やメタ的な思考能力が改善される気がしていて、それ自体が愉しみなんだなと感じます。久しぶりに研究して遊べてますね。

参考文献

駒宮 俊友『翻訳スキルハンドブック』

山田優『ChatGPT翻訳術 新AI時代の超英語スキルブック』