きっと今後も似たような話をすることが多そうなのでQiitaのプレゼンテーションモードにしてみようとも思ったらうまくいかなかったので、結局PDF化したものをSpakerDeckに用意しましたが、それなりに書いたのでQiitaの方も残しておきます。
SpeakerDeckにあるものと内容としてはほぼ同じです。
TensorFlowの概要
まずはTensorFlowの概要っぽい部分のお話です。
TensorFlowとは?
- TensorFlowのサイト
- Googleがオープンソース化した機械学習ライブラリ
- 2015年11月に公開
- Google社内で実際に使われているものである(らしい)
- 私はGooglerではないので伝聞形式とする
TensorFlowのモデル
- 学習モデルをTensor計算のグラフとして定義する
- Tensorは多次元配列のこと
- Tensorが流れる計算グラフを作るのでTensorFlowという名前になったかと
- 学習を実際にどう行うかも定義する
- 学習の評価方法
- 最適化の方法
- CPUで計算 or GPUで計算
- スタンドアロン or 分散
- etc...
- 定義した計算をデバイス上で実行させる
TensorFlowの歴史
この一年で急速に、かつ着実に機能を追加してきています。
TensorBoardなどのツール
TensorBoardはTensorFlowのポイントの1つです。グラフを可視化してくれたり、処理の経過を可視化してくれたり様々な機能を提供してくれる便利ツールです。
その他のTensorFlow情報
下記は会場でのみお話します。某所から共有頂きました資料をベースにお話します。
- Google内でのTensorFlowの利用例
- TensorFlowの活用事例
- TensorFlowコミュニティ
- 企業でのTensorFlow
TensorFlowの基本
続いて、TensorFlowの技術的な部分の基本をお話します。
以前、DevFest Tokyoで話した資料からの抜粋となりますので、興味が湧いた方はフルバージョンも参照してみてください。
TensorFlowの超基本
TensorFlowはグラフベースで計算を行います。
TensorFlowのパラダイム
- はじめにテンソル(Tensor)の演算グラフを作ります
- グラフの事項単位をセッション(Session)と言います
- 定数(constant)、変数(Variable)、プレースホルダ
- (Placeholder)を宣言できます
- 作ったグラフはデバイス(CPUやGPU)に展開され実行されます
- 分散処理も実行可能です
ここだけ押さえればTensorFlowの基本っぽいのが分かる簡単な例
- 足し算
- 演算(Operation)
- カウントアップ
- 変数(Variable)
- 入力値を色々と変える
- プレースホルダー(Placeholder)
- セッションを使う
- セッション(Session)
- 高ランクなテンソルの演算
- テンソル(Tensor)
例1:足し算 - Operation
# (定数)+(定数)の足し算
import tensorflow as tf
# 入力となる定数の定義
x = tf.constant(1, name="x")
y = tf.constant(2, name="y")
add_op = tf.add(x, y)
with tf.Session() as sess:
print(sess.run(add_op))
演算がグラフのノードとなるようなグラフを定義します。
例2:カウントアップ - Variable
import tensorflow as tf
# cntという変数(カウンター)の定義
cnt = tf.Variable(0, name="cnt")
inc = tf.constant(1, name="inc")
# カウントアップ
add_op = tf.add(cnt, inc)
# cntの値を更新
up_op = tf.assign(cnt, add_op)
with tf.Session() as sess:
# 変数を使う場合はまず初期化が必要
sess.run(tf.global_variables_initializer())
# カウントアップを計3回実行
print(sess.run(up_op))
print(sess.run(up_op))
print(sess.run(up_op))
代入可能な箱としてVariableというものがあります。計算結果を保持させることを目的に利用します。計算を始める前に初期化が必要です。
例3:入力値を色々と変える - Placeholder
import tensorflow as tf
# 定数の定義
x = tf.constant(1, name="x")
# プレースホルダーという箱を用意する
y = tf.placeholder(tf.int32, name="y")
# x+yの演算を定義
add_op = tf.add(x, y)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
# プレースホルダーには、feed_dictという仕組みを通じて値を外挿できる
print(sess.run(add_op, feed_dict={y:1}))
print(sess.run(add_op, feed_dict={y:3}))
Placeholderは実行時にfeed_dictという仕組みを通じて値を外挿できる仕組み。つまり、入力データの箱として利用します。
例4:セッションを使う - Session
import tensorflow as tf
cnt = tf.Variable(0, name="cnt")
inc = tf.constant(1, name="inc")
add_op = tf.add(cnt, inc)
up_op = tf.assign(cnt, add_op)
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print(sess.run(up_op))
print(sess.run(up_op))
print(sess.run(up_op))
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
print(sess.run(up_op))
print(sess.run(up_op))
print(sess.run(up_op))
例5:高ランクなテンソルの演算 - Tensor
import tensorflow as tf
# ランク2のテンソル(行列)の定義
x = tf.constant([[1,2], [1,2]], tf.int32, name="x")
y = tf.constant([[3,4], [3,4]], tf.int32, name="y")
# 行列の足し算
add_op = tf.add(x, y)
with tf.Session() as sess:
print(sess.run(x))
print(sess.run(y))
print(sess.run(add_op))
これまでは単なる数値の計算を行っていましたが、テンソルは多次元配列であり、その特殊な形式として数値があります。すなわち、ここまでと同じ処理を多次元に拡張しても動作します。
今回はランク2のテンソル、すなわち行列の足し算を行っています。
次にどうする?
残念ながらここまででディープラーニングや機械学習ができるようになったわけではありませんが、TensorFlwoの基本中の基本は理解頂けたかと思います。より深くTensorFlow自体や、あるいは深層学習について学びたい方はのTensorFlow本家のチュートリアルを進めていくのが良いでしょう。