前々からの持論、そしてアプリ開発のヒントに至るまで
言語APP
昨年までに開発を終えているのは、FLASKを使った多言語辞書である。
実はSTREAMLITで置き換えようとか、REACTネイティブで開発しようとか、色々模索はしていたのであるが、一向に箸が進まない状態が続いていた。要するにアプリの開発コンセプトが、少しあいまいだったのが原因である。
勉強法
最近の英語の勉強方法を少し触れておく
- Audibleでひたすら読書の音声を聞きまくる
- 毎日、2時間以上のリスニングと、睡眠時は装着したまま脳内にインプット
- イヤホンは耳が痛いので、骨伝導ヘッドホンを使用
成果
段々と耳が慣れてきて、知っている単語はほとんど理解できる状態になった。
アメリカ英語、ブリティシュ英語の違いがあるので、発話者をいろいろ変えて学習データを水増ししている。
課題感
結局、何十回聞いても、分からない単語は分からない状態で終わっている。
テキストファイルを最終的には購入して確認する必要がある。
やりたいこと
書籍のジャンルによって、頻出する単語リストのようなものを作りたい。
これを元に、単語学習用の音声ファイルを作りたい(単語には意味理解できる情報を足してデータ化)
文章の中での、特徴的な文章(フレーズ)を抽出して、文章リストのみのMP3ファイルを作りたい
仕様① 重要語
- テキストデータは、垂れ流して、BOWを作り頻出度(TF)を抽出する。
- 自分の暗記済み単語との差分を抽出する
- 単語を日本語翻訳(もしくは英英辞典)を通して、意味情報を加える。
- テキストデータをMP3化する
仕様② 特徴語句
- 暗記ワードを含んだ文章をリスト化する
- 日本語訳、英語を交互に並べたテキストデータを作る
- テキストデータをMP3化する
まとめ
ひとまずデータ入力から、アウトプットまでのフローをまとめました。