Help us understand the problem. What is going on with this article?

[WIP]自然言語処理における前処理のメモ

この記事は自然言語における前処理を読んだ際の備忘・メモ書きです。

数値の置き換え

99や1.235などを0にするように、数値も正規化するんですね。確かに自然言語処理で分析したいこととは関係ないことが多そう。

ストップワードの除去

これに限った話ではないですが、コードサンプルがあっていいですね。
あと、ストップワードの選び方も意味ベースや頻度ベースと復習にちょうどいい。

前処理ありとなしの比較

実行時間差が大きい。精度よりも重要じゃなかろうか。

brainpad
ブレインパッドは、2004年の創業以来、データによるビジネス創造と経営改善に向き合ってきたデータ活用・分析企業です。
http://www.brainpad.co.jp/
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Comments
No comments
Sign up for free and join this conversation.
If you already have a Qiita account
Why do not you register as a user and use Qiita more conveniently?
You need to log in to use this function. Qiita can be used more conveniently after logging in.
You seem to be reading articles frequently this month. Qiita can be used more conveniently after logging in.
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ユーザーは見つかりませんでした