Kerasを学ぶ

今後の作業の中で、まず学ぶべきはDeepLearningのモデルを考える必要がある。
それ以外については、今まで学んだ内容を応用すればどうにかなるが、どうにもこうにもベースになるモデルがなければ話にならない

まず何を学ぶ?

Kerasを学ぶを書いたものの、漠然としすぎて何から手を付けてよいかわからない、、、。

ざっくりやりたいこと
- FXのデータがCSVなどであるので、それをDatasetとしたい
- そのデータに対してなにかのAlgorithmを適用し結果を予想したい

まずは情報を探す

https://qiita.com/KeisukeToyota/items/c1c626c9efc816932a96
こちらのサイトで詳細されていた情報をもとに、情報を掘り下げていく。

ソースコードを読んで見る

まず、最初に気になるのがやはりモデルの部分。
と言うことで、サンプルソースのあったリンクをたどる(https://github.com/keras-team/keras/blob/master/examples/mnist_cnn.py)
で次に、この中でどんな処理をしているのか、上から追ってみる、、、。

最初の定義などは一旦無視。この辺はプログラム上あとで必要となるだろうから、とりあえずプログラムの内容を先に読む。フムフム、、、

# the data, split between train and test sets (x_train, y_train), (x_test, y_test) = mnist.load_data()

最初のプログラム部分がここですかね。(変数の定義などもすべてすっ飛ばしています)
まずは、データの読み込み、、、。
これを調べてみると、mnist.load_data()と言うのでデータをLoadしているようだ。

from keras.datasets import mnist

もともとkerasにはいくつかのdatasetが用意されていて、そのデータを読み込んでいるんだな、、、。Keras Datasets

でも、これってどんなデータ形式なんだろう。とりあえず、Jupyterで実行だ‼

Loading data...
Downloading data from https://s3.amazonaws.com/text-datasets/reuters.npz

こんな感じ。AWSにあるnpzと言うファイル形式のものを使っているようだ。
じゃあ、npzってなんぞや。

https://www.python-izm.com/data_analysis/numerical/numpy/ndarray_filerw/
こちらのサイトを見ると、NumPyのデータ配列を保存したもののようですね。
npzなのでバイナリー式の非圧縮/圧縮の形式で作られたものと言うことが判明。
実際、現時点では圧縮、非圧縮のいずれでも構わない。
ちなみに、サイトにあるサンプルを実行した結果

ファイル形式	圧縮有無	ファイルサイズ
text	non compress	150bytes
binary	non compress	562bytes
binary	compress	393bytes

まぁ、binaryモードは複数表を保持している事と、binaryにしているのでtextより少し大きくなっているのだろう。でも、binary-compressを採用。

じゃあ、次は

と模索していると、
https://inon29.hateblo.jp/entry/2017/06/23/183749
と言うサイトを発見‼
こちらも私と同じような考えでソースを読み解こうとしているので、ここは参考にさせていただくことにしました。

余談

「つづく」と言う言葉がタイでは人気があるらしく、Tシャツにもなっているらしい
http://netgeek.biz/archives/105470
ただ、これは完全に勘違いで、日本のTV番組の終わりに「つづく」と表示されているが、これがその回の終わりであり、まだシリーズは続く、、、と言う意味なのだが、これが「おわり」と理解されていて、それが良い言葉だとして人気となっているようす。
海外のTVシリーズでは「To be continue」となっているので普通に考えれば、、、と思うがｗｗ

まずはKerasのお勉強

Kerasを学ぶ

まず何を学ぶ?

まずは情報を探す

ソースコードを読んで見る

じゃあ、次は

余談