内容紹介
自然言語処理(NLP:Natural Language Processing)の実践的な入門書です。
「自然言語」とは、英語や日本語など人々が日常のコミュニケーションで使う言語のことで、
NLPに基づく技術は、モバイル端末におけるテキストの予測や手書き文字認識、検索エンジンにおける統一されていないテキスト内の情報取得、機械翻訳においてはある言語で書かれたテキストの分析と多言語への変換など、広範囲に活用されるようになってきています。
本書では、NLPの理論的な基礎、理論、応用をバランスよく解説。
本書の例から学び、実際のプログラムを書き、そして実装することを通して、読者はNLPを始めるための実用的な知識と技術を得られるでしょう。
著者について
Steven Bird (スティーブン・バード):メルボルン大学のコンピュータサイエンスおよびソフトウェアエンジニアリング専攻准教授であり、ペンシルバニア大学の言語データコンソーシアムではシニアリサーチアソシエイトも務める。2009年にはコンピュータ言語学会の会長に就任。
Ewan Klein (エワン・クライン):エジンバラ大学情報学部の言語テクノロジーの教授。1978年にケンブリッジ大学でセマンティクスで博士号を取得。ELSNETの創設メンバーでもある。
Edward Loper (エドワード・ローパー):ペンシルバニア大学で、自然言語処理のための機械学習で博士号を取得したばかりの新進気鋭の学者。NLTKの開発者でもある。
レビュー
★★★★言語を分析することに興味がある人に
自然言語処理といっても多分いろいろあるのだと思いますが、「単純な言語モデルでも大量のデータと高度な統計処理を組み合わせるとびっくりするような結果を引っ張り出せる」みたいな派手(?)な話というよりは正攻法で言語の分析にアプローチする内容が紹介されています。
→着実に言語を分析していく様な内容
★★★★学生にはお勧め
まだ全て読んではいないのですが
リファレンス的な用途においては良書だと思います
(そもそもリファレンス的な自然言語処理の本なんて数えるほどしかないと思いますが)
恐らく言語の専門家や研究室が「喜んで読む」ものではなく、「とりあえず買っておく」類の物でしょう
★★★★★Pythonを用いた実践的な自然言語処理のガイドブック 日本語処理もあるよ!
日本語処理については新しく書き下ろされた12章で扱っており、文字コードの問題から形態素解析・構文解析(係り受け解析)・意味解析・かな漢字変換と濃い内容が目白押しです。原著も分厚かったですが、邦訳はさらに分厚い。
→日本語の処理もあるよ
★★★買う必要はないです。
正直、python の解説が入門書レベルで邪魔だった。
python 初めてで自然言語処理をやる人は買うのもありだと思います。
→なのでpythonの基本文法については飛ばします
学べること
- 簡単なプログラミングを用いて、どのように言語データ操作および解析することができるか、そしてどのようなコードをどう書くか
- NLPと言語学の重要な概念が、どのように言語の記述と解析に用いられるか
- どのようなデータ構造とアルゴリズムがNLPで用いられるか
- 言語データをどのように標準的なフォーマットで保存するか、そしてNLP技術の性能の評価に対してデータがどのように利用できるか
目次
- 言語処理とパイソン
- テキストコーパスと語彙資源へのアクセス
- 生テキストの処理
- 構造化されたプログラムを書く(※pythonの文法なのでパス)
- 単語の分類とタグ付け
- テキスト分類の学習
- テキストからの情報抽出
- 文構造の分析
- 素性ベースの文法の構築
- 文の意味の解析
- 言語データの管理
- pythonによる日本語自然言語処理