いろいろあって自然言語処理をやることになりました。
一言で機械翻訳と言っても、やはり複数の分野から構成されていて、
・データ解析
・自然言語処理
・機械学習
と、ただでさえ重い内容がいっぱいあってとても重い。処理内容的にも、とても重い。
翻訳のための機械学習も、現在の主流はディープラーニングなので、必要な学習データ量や計算資源がとんでもないのがハードル高い。
google翻訳あるし敵わないからやる価値なくね?とかいうな。
そういうこと言えてしまう人間の方が存在価値ないぞ。
ということで最初に参考になったHPを紹介してみる。
最初に参考になったHP
・Python による日本語自然言語処理(http://www.nltk.org/book-jp/ch12.html)
『入門 自然言語処理』の日本語版で追記された第12章のみ、無償で公開されている。
無償で公開している内容にもかかわらず、日本語における自然言語処理の概要を把握するのに十分な内容がまとまっている。
・首都大学東京 小町研HP(http://cl.sd.tmu.ac.jp/)
自然言語処理界隈についてよくまとめられている。
というか『自然言語処理が学べる研究室』と『自然言語処理を独習したい人のために』で得られる情報が、初学者にとってありがたいうえこの上ない。
・言語処理100本ノック (http://www.cl.ecei.tohoku.ac.jp/nlp100/)
もはや鉄板の言語処理練習教材らしい。
pythonでの文字列処理を学ぶのにも優秀。
険しい道のりだけど、こつこつと精進していきます。
以下、学習に使ったHP
言い換え系論文リスト
・否定の焦点情報アノテーション 電通大 松吉俊 2014/4/1
https://www.jstage.jst.go.jp/article/jnlp/21/2/21_249/_article/-char/ja/
・日本語文章に対する述語項構造アノテーション仕様の考察 2014/4/1 〇
https://www.jstage.jst.go.jp/article/jnlp/21/2/21_333/_article/-char/ja/
・言い換え技術に関する研究動向 乾健太郎 2004/
https://www.jstage.jst.go.jp/article/jnlp1994/11/5/11_5_151/_pdf/-char/ja
・ニューラルネットワークによる日本語述語項構造解析の素性の汎化 乾健太郎 2017/3
http://www.anlp.jp/proceedings/annual_meeting/2017/pdf_dir/B4-5.pdf
・日本語述語項構造アノテーションにかかわる諸問題の分析 松林雄一郎 2013/11/15
https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=95868&file_id=1&file_no=1
・日本語深層格の自動抽出のためのコーパス開発 2012/3
http://www.anlp.jp/proceedings/annual_meeting/2012/pdf_dir/P1-3.pdf
・二格深層格の定量的分析 2014/3
http://www.anlp.jp/proceedings/annual_meeting/2014/pdf_dir/P5-3.pdf
・機械学習を用いた二格深層格の自動付与の検討 2014/3
http://box.jnlp.org/arc/14/14NLP-takeno.pdf
・格助詞「に」の深層格推定 -格助詞の意味再考- 2008/11/19
https://ipsj.ixsq.nii.ac.jp/ej/?action=repository_uri&item_id=47665&file_id=1&file_no=1
・頑健な格解析を実現する各フレーム辞書の自動構築 2002/2
http://nlp.ist.i.kyoto-u.ac.jp/member/kawahara/paper/NLP2002-2.pdf
・文体と難易度を制御可能な日本語機能表現の言い換え
https://www.jstage.jst.go.jp/article/jnlp1994/15/2/15_2_75/_pdf/-char/ja
スライド
・統計的係り受け解析入門 2010/10/10
https://www.slideshare.net/unnonouno/ss-5724050
・述語項構造と照応関係のアノテーション
http://www.anlp.jp/anniversary/20th_sympo/slide_iida.pdf
・統計的係り受け解析入門
https://www.slideshare.net/unnonouno/ss-5724050
・自然言語処理プログラミング(ビタビアルゴリズムについての参考になった)
http://www.phontron.com/slides/nlp-programming-ja-04-ws.pdf
その他
・格文法と格フレーム
http://www.jaist.ac.jp/~kshirai/lec/i223/06.pdf
・自然言語処理 主要研究室まとめ
http://cl.sd.tmu.ac.jp/prospective/labs
・言語情報処理用語集
http://www.jaist.ac.jp/project/NLP_Portal/doc/glossary/#i0198
・KNP
http://nlp.ist.i.kyoto-u.ac.jp/?KNP