Kerasを学ぶ
今後の作業の中で、まず学ぶべきはDeepLearningのモデルを考える必要がある。
それ以外については、今まで学んだ内容を応用すればどうにかなるが、どうにもこうにもベースになるモデルがなければ話にならない
まず何を学ぶ?
Kerasを学ぶを書いたものの、漠然としすぎて何から手を付けてよいかわからない、、、。
ざっくりやりたいこと
- FXのデータがCSVなどであるので、それをDatasetとしたい
- そのデータに対してなにかのAlgorithmを適用し結果を予想したい
まずは情報を探す
https://qiita.com/KeisukeToyota/items/c1c626c9efc816932a96
こちらのサイトで詳細されていた情報をもとに、情報を掘り下げていく。
ソースコードを読んで見る
まず、最初に気になるのがやはりモデルの部分。
と言うことで、サンプルソースのあったリンクをたどる(https://github.com/keras-team/keras/blob/master/examples/mnist_cnn.py)
で次に、この中でどんな処理をしているのか、上から追ってみる、、、。
最初の定義などは一旦無視。この辺はプログラム上あとで必要となるだろうから、とりあえずプログラムの内容を先に読む。フムフム、、、
# the data, split between train and test sets
(x_train, y_train), (x_test, y_test) = mnist.load_data()
最初のプログラム部分がここですかね。(変数の定義などもすべてすっ飛ばしています)
まずは、データの読み込み、、、。
これを調べてみると、mnist.load_data()
と言うのでデータをLoadしているようだ。
from keras.datasets import mnist
もともとkerasにはいくつかのdatasetが用意されていて、そのデータを読み込んでいるんだな、、、。Keras Datasets
でも、これってどんなデータ形式なんだろう。とりあえず、Jupyterで実行だ‼
Loading data...
Downloading data from https://s3.amazonaws.com/text-datasets/reuters.npz
こんな感じ。AWSにあるnpzと言うファイル形式のものを使っているようだ。
じゃあ、npzってなんぞや。
https://www.python-izm.com/data_analysis/numerical/numpy/ndarray_filerw/
こちらのサイトを見ると、NumPyのデータ配列を保存したもののようですね。
npzなのでバイナリー式の非圧縮/圧縮の形式で作られたものと言うことが判明。
実際、現時点では圧縮、非圧縮のいずれでも構わない。
ちなみに、サイトにあるサンプルを実行した結果
ファイル形式 | 圧縮有無 | ファイルサイズ |
---|---|---|
text | non compress | 150bytes |
binary | non compress | 562bytes |
binary | compress | 393bytes |
まぁ、binaryモードは複数表を保持している事と、binaryにしているのでtextより少し大きくなっているのだろう。でも、binary-compressを採用。
じゃあ、次は
と模索していると、
https://inon29.hateblo.jp/entry/2017/06/23/183749
と言うサイトを発見‼
こちらも私と同じような考えでソースを読み解こうとしているので、ここは参考にさせていただくことにしました。
余談
「つづく」と言う言葉がタイでは人気があるらしく、Tシャツにもなっているらしい
http://netgeek.biz/archives/105470
ただ、これは完全に勘違いで、日本のTV番組の終わりに「つづく」と表示されているが、これがその回の終わりであり、まだシリーズは続く、、、と言う意味なのだが、これが「おわり」と理解されていて、それが良い言葉だとして人気となっているようす。
海外のTVシリーズでは「To be continue」となっているので普通に考えれば、、、と思うがww