とりあえず作ったもの
使ってみてね!!
概要
言わずもがな、テキストを入力すると「クソデカ羅生門」みたいにしてくれるアプリです。
どうやっているのか
コードは公開できるほどのものではないですし、テキスト変換の精度も低いので、ここではざっくりとだけ説明します。とりあえずさっさと作りたかったのですごく雑なアルゴリズムです。
- クソデカ羅生門と羅生門の差分から、どのような単語の前に「クソデカ」みたいな言葉(クソデカワードとします)が挿入されているかの辞書(クソデカ辞書)を作る(例:"羅生門": ["正気を疑うレベルでデカい", "クソデカい", "クソデカ", "トチ狂ったクソデカさの"])
- Mecabで形態素解析して、入力テキストの単語の品詞を特定する。
- 一般名詞など特定の品詞の単語の前にクソデカワードを挿入する。この時、クソデカ辞書から、入力の単語と類似度が一番近いkeyのvalueを選んで挿入する(gensim使用)
- 最後に言語モデルで出力テキストの自然さを評価し、おかしな部分がないかチェックする(あまりうまく行ってない)
- webアプリはflaskで作っています。
最後に
ぜひいろいろ遊んでみてほしいのですが、「こうすればもっとうまくいく!」「こういう機能をつけたら良いんじゃない?」などコメントいただけるととてもありがたいです!
感想としては、webアプリを簡単にでも自作できて楽しかったのと、座学で勉強していたNLPをちょっとでも実践に活かせたのでよかったです。