LoginSignup
3
1

More than 3 years have passed since last update.

超絶簡単にテキストコーパスを作ってザクザク自然言語処理できてしまう。

Posted at

あらすじ

テキストコーパスを作ろうとしたけどネット記事やブログ、youtubeにネタが散在してて
スクレイピングがめんどい。ネタ元がAPI対応してなかったりでどうしよっか。。

あと根性で抜き出しても精度があんまりだったら嫌だな。サクっと確認もできないものか。

あ、やりたいのに合わせて作ってしまえばいい!

作ったもの

クリップボードを監視してテキストが来たら自動で分かち書きに変換して出力します。
ショートカットキーでモデル作って、選択したテキストで試しに予測精度見れます。

そんだけですが超絶楽です:grin:

demo.gif

youtubeの文字起こしからも抜けます!

regexp.png

コード

ここです

fasttextじゃなくてもっと最近のツール使えないの?

すみません、貧弱な大昔ノートPCなもので。。

というかこういうの既にありそうな気がする。ちゃんとしたのもうあったら申し訳ない。。

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1