fbpx

GitLab CIを活用した英日翻訳改善 #gitlab #gitlabjp #docker #devops #kaizen

この記事は1年以上前に投稿されました。情報が古い可能性がありますので、ご注意ください。

GitLab CIを活用してLaTeX英日翻訳を改善しました。

とあるLaTeX英語文書の和訳に、最初はGitLabのWeb IDEを利用していました。
しかしWeb IDEは翻訳ツールではないため、同じ文や似た文を参考として表示する機能がなく、用語や文体の統一に手間がかかったり、原文が更新された際の追従が非常に大変でした。

弊社ではコンピュータ翻訳支援(Computer Assisted Translation; CAT)ツールとしてOmegaTを採用していますが、今回の原文であるLaTeX文書にはさまざまな拡張が施されていたため、対象訳文の抽出や訳文ファイル生成に問題があり、そのまま使うことができませんでした。

そこでpo4aというツールをLaTeX文書とOmegaTの間に挟み、OmegaTではPO (Portable Object)ファイルを翻訳するという手順を取ることにしました。po4aの対象訳文の抽出はカスタマイズが可能なので、LaTeX文書の拡張部分に対応することができました。

しかし、

  1. po4aで原文LaTeX文書を原文POファイルに変換
  2. OmegaTで原文POファイルを翻訳
  3. OmegaTで訳文POファイルを生成
  4. po4aで訳文POファイルと原文LaTeX文書から、訳文LaTeX文書を生成
  5. LaTeXコンパイラで訳文LaTeX文書から、訳文PDFを生成

これらすべてを手動で行うのは大変骨が折れるため、OmegaTで翻訳を行う箇所(2.)以外はGitLab CIとDockerを活用して自動化しました。

これにより、Web IDEで翻訳を行っていたころの期間に比べて、88日から24日に短縮できました。
作業期間を3分の1に短縮できたこともさることながら、各種中間ファイルの生成を自動化したことで、翻訳担当者の目からすれば「翻訳したらPDFが出てくる」ほどの効率アップを実現できました。

クリエーションライン株式会社では DevOpsエンジニアを募集 しています。

Author

Chef・Docker・Mirantis製品などの技術要素に加えて、会議の進め方・文章の書き方などの業務改善にも取り組んでいます。「Chef活用ガイド」共著のほか、Debian Official Developerもやっています。

Daisuke Higuchiの記事一覧

新規CTA