あらすじ
テキストコーパスを作ろうとしたけどネット記事やブログ、youtubeにネタが散在してて
スクレイピングがめんどい。ネタ元がAPI対応してなかったりでどうしよっか。。
あと根性で抜き出しても精度があんまりだったら嫌だな。サクっと確認もできないものか。
あ、やりたいのに合わせて作ってしまえばいい!
作ったもの
クリップボードを監視してテキストが来たら自動で分かち書きに変換して出力します。
ショートカットキーでモデル作って、選択したテキストで試しに予測精度見れます。
そんだけですが超絶楽です
youtubeの文字起こしからも抜けます!
コード
fasttextじゃなくてもっと最近のツール使えないの?
すみません、貧弱な大昔ノートPCなもので。。
というかこういうの既にありそうな気がする。ちゃんとしたのもうあったら申し訳ない。。