7
2

More than 1 year has passed since last update.

『プログラマーのための圏論』を全訳した作業環境メモ

Last updated at Posted at 2023-02-05

Bartosz Milewski著 "Category Theory for Programmers" を全文和訳したので、翻訳の経過と作業環境について自分用に記録を残しておきます。

※当記事では本の内容や圏論についての解説はしません。誤訳の指摘等もコメント欄ではなくgithubで。

翻訳成果物は『プログラマーのための圏論』というタイトルにし、githubでmarkdownソースおよびhtml版として公開しています。2023年1月末時点で下訳が終わった段階で、推敲はまだ途中なので、確実に誤訳を含んでいます。

これまでの過程

翻訳の動機

  1. プログラミングの知識を足がかりにして圏論を勉強できそうな良書だと思ったから。
    • あわよくば関数型プログラミングの理解が深められるのを期待した。
  2. 書籍1冊分の翻訳を経験してみたかったから。
    • OSSのドキュメントやUIの和訳をやっていた経験が活きるか。
  3. 社会貢献

かかった期間

約1年かかりました。

  • 2018年に第1章の途中まで訳して放置
    • 他のOSS活動とか引っ越しとかがあって忙しかったので…。
  • 2022年3月上旬に翻訳再開し、2023年1月下旬に下訳完了
    • 1日あたり20文以上を目標にし、調べ物含めて平均1時間くらい? (毎日作業していたわけではない)

翻訳に使った環境

翻訳メモリとしてフリーウェアのOmegaTを使いました。

  • 原文と訳文を上下に並べて表示
  • 既に翻訳した文と似た文が出てきたら、翻訳済みのものを参考訳文として表示
  • 用語集に入れておいた語句を自動表示
  • 機械翻訳との連携
  • 翻訳の進捗(翻訳済み文節数など)の統計
  • git連携による自動コミットやグループ翻訳

などの機能があります。

過去にUI翻訳(似た文が頻出し表記ゆれに厳しい)で使って非常に有用だった経験がありました。今回はそれとは原文がだいぶ違った形なので使うべきか迷いましたが、結果としては大いに役立ちました。

環境構築

  1. OmegaTをダウンロードしてインストールする。
    • 通常版・最新版のどちらでも良い。ただし、複数のPCで作業する場合はバージョンを揃えておくのが良さそう。
    • インストーラーの種類で迷ったら各OS用のJRE付きのものを選ぶのが無難。
    • macOSではhomebrewで通常版がインストールできる。
    • Windowsではwingetで最新版がインストールできるようにした
    • Linuxではディストリビューションによってはパッケージが古いことがあるようなので要注意。
  2. Okapi Filters pluginをインストールする。
    • markdownなどの、OmegaTが直接サポートしていないファイル形式を扱えるようになる。
    • ダウンロード・展開し、jarファイルをpluginsディレクトリーに入れる。
    • pluginsディレクトリーのパスが分からない場合は、OmegaTのメニューから「設定」→「設定フォルダー」を使って調べられる。
  3. 機械翻訳との連携の設定(必要に応じて)
    • OmegaTのメニューの「設定」→「環境設定」→「機械翻訳」で
      • 「翻訳を自動的に取得する」にチェックを入れる。
      • 利用したいサービス名を選択し、右欄にチェックを入れる。
      • サービスごとに「設定」ボタンを押してAPIキーなどを設定する。
  4. gitレポジトリの設定
    • OmegaTで翻訳中は定期的に自動でコミットとプッシュが行われる。
      また、訳文生成前とプロジェクトを閉じるタイミングでも行われる。
    • ヘルプの日本語版では使い方の説明がないが、英語版には載っている。

原文の準備

もともとLaTeXソースを有志によるPDF版のレポジトリから持ってきて翻訳していたけど、OmegaTのLaTeXパーサで分節化がうまくいかなかった(詳細は忘れた)ので、途中からmarkdownに変えました。

LaTeXからmarkdownへはsedでざっくり変換したあと、大量の修正を手作業で行いました。pandocでやれれば良かったけど、今回の原文ではすんなりいかないらしい。

訳文のスタイル

敬体か常体か

いわゆる「です・ます」対「である・だ」。今回は文末は「だ」で統一、文中のみ場合によっては「である」を許すことにしました。根拠といえるほど深い理由はないですが、専門書寄りなので簡潔な文体にしたかったからです。

訳語や表記のゆれ

上の項目とも関連しますが、準拠すべきスタイルガイドを最初に決めて、きっちり従うのが良いです。作業中はつい、スタイルで迷っても確認せずに翻訳を進めてしまうことが多く、後々修正するのが大変でした。

OmegaTで「ツール」→「品質チェック」を使ったり、JTF日本翻訳連盟の日本語スタイルチェッカーなどを活用し、訳文の品質をこまめに確認するのが良いです。

また、ゆれが起きやすい語については早い段階で単語登録すると便利です。

  • 例:equivalent = 等価(同値ではなくこちらに統一)

ひととおり翻訳した後のチェック

目視確認は、OmegaT上でも良いけど、できるだけ最終フォーマットに近い形(epub化して電子書籍リーダーで読むなど)で確認した方がミスに気付きやすいようです。蛍光ペン機能のあるepubリーダーアプリで通勤電車の中でチェックしたりしてたな…。

確認しながらその場で修正するためにOmegaT上でやるなら、フォントを等幅・ゴシックからプロポーショナル・明朝体に変えるだけでも多少は効果があります。

反省点・はまったところ

翻訳済みの原文を途中で大幅に改変してしまった

前述のとおり、途中でLaTeX→markdownに変えました。既に翻訳していた文節は訳文候補として表示されるので完全に無駄にはなりませんが、微妙に異なる部分をちまちま修正する必要が出ました。

ただし、まったく新規の原文ファイルを追加するのは何の問題もありません。

検索・置換で前方参照が使えなかった

普段vimでテキスト編集するときには正規表現の前方参照をよく使うのですが、OmegaTでは使えず不便でした。OmegaTの取扱説明書には載っていないけど「幅ゼロの肯定先読み」などなら使えたのでそっちで何とかしました。この話題については別記事を書きたいと思います。

あとで知ったけどVS Code標準機能の検索でも同様なんですね…。VsVimばかり使っていたから気付きませんでした。

既に日本の出版社が原著者にコンタクトしていた

しかも2018年11月時点で。ただ、話は進んでないのではないかと推察します。

よりにもよって翻訳が終わったあとで気付いたので複雑な気分…。先に知ってたら手を付けなかったと思います。

原著者に問い合わせしたところ、この記事の初版投稿後に

  • 出版の予定はない
  • 翻訳の公開は問題ない

との返事をもらえました。一安心です。

翻訳の参考にした文献(主なもののみ)

圏論に関して:

pandoc, markdownの使い方に関して:

翻訳・推敲に際して(随時追記予定):

おわりに

詳しくない分野の書籍1冊を翻訳するのは、思った以上に大変でしたが、良い経験になりました。…と言っても、まだまだ推敲が終わってないので先は長いです。

7
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
7
2