LoginSignup
8
6

More than 5 years have passed since last update.

Mosesの後輩への引き継ぎのためのまとめ

Last updated at Posted at 2016-09-02

この記事の目的

「言語処理研究室の後輩」がMosesを使う(動かす)ために、できる限り最低限必要な情報および情報にたどり着く道筋をまとめる。(基本的に日本語の情報)
全てを理解するのは厳しいので、こんな情報があるということを頭に入れておく。

統計的機械翻訳の概要

*順不同

統計的機械翻訳を構築するためにさまざまな手法があることや、評価にもいろいろあることを知っておく。

Mosesの概要

Mosesは統計的機械翻訳システムである。
対訳コーパスを用意すれば、統計的機械翻訳を試すことができる。
いろいろな統計翻訳の手法が実装されている。
ExternalToolsなどもかなり有益なツールの情報があるので、一度目を通すこと。
英語で検索できると、エラーはかなり解決できる。

Linuxの知識

Linuxの知識がないと、いちいち操作に手間取るのでできる限り習得すること。

  • 必要な知識

    • Linuxの基本的なディレクトリ操作
      • ディレクトリ操作
      • 圧縮・解凍
      • 相対パス・絶対パス
    • 環境変数の知識
    • 共有ライブラリの知識
    • configure
      • インストール先オプションが指定できることを知っていること
    • シェルスクリプト
    • 初歩的なGit
  • Linux LPIC - Library

インストールや実行

*順不同

作業の残し方

単語分割の方法やパラメータなどがわからなくなるため、実験管理ツールやシェルスクリプトを用いるのがおすすめ

前処理

英語

  • 小文字化
  • 記号の置換

日本語

  • 単語分割
  • 半角・全角の統一
    • NFKCなど
8
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
8
6