Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
178
Help us understand the problem. What is going on with this article?
@okappy

Amazonがオープンソースで公開したディープラーニングのライブラリ「DSSTNE」を使ってみる

More than 3 years have passed since last update.

スクリーンショット 2016-05-24 午後4.01.50.png

DSSTNEとは?

DSSTNEは、Deep Scalable Sparse Tensor Network Engineの頭文字を並べたもので、読み方は“Destiny”と読むらしい。

なぜ今アマゾンがDeep Learning(DL)のオープンソースを発表したのか?

DSSTNEは、既存のDeepLearningのオープンソースよりも、データがSparse(疎)なときに高いパフォーマンスを示すため、Amazonのように大量の商品データ、ユーザーデータを持ち、その二つのオブジェクトが購買、評価などの行動をした行動データを持つような疎行列データを持つ場合に強いDeapLearningのオープンソースと言える。

スパース(疎)行列データとは?

疎行列(そぎょうれつ、英: sparse matrix)とは、成分のほとんどが零である行列のことをいう。 スパース行列とも言う。 有限差分法、有限体積法、有限要素法などで離散化された偏微分方程式は一般に疎行列を係数行列とした連立一次方程式となる。(引用:wikipedia)

SNSやフリマなどのCtoCサービスや、ECやメディアなどのユーザーとコンテンツの関係が変化していくサービスでは、大量のコンテンツとユーザーの間に、またはユーザーとユーザーとの間に疎行列のようなデータ構造ができあがることが多い。

その需要は今後も拡大していくことが予想される中で、DSSTNEは"使いやすい"DeepLearningのライブラリになりそうな気がする。

DSSTNEは他に比べて何がすごいのか?

  1. EC2のg2.8xlargeインスタンスで、GoogleのTensorFlowに比べて2.1倍のスピードが出る
  2. マルチGPUでのスケーリングによりスピードと正確性の両立を実現している

詳しくはここを参照(※英語を汲み取り間違えてたら教えて下さいw)

DSSTNEの実装環境

DSSTNEを利用する方法として以下の主な手法になります。
- Docker
- AWS
- 開発マシン

AWSで実装する場合、事前に環境構築を完了した状態のAMIを用意してくれているので、今回はAWSで実装してみます。

この画面のCommunity AMIsを選択して、検索ボックスに「ami-d6f2e6bc」と入力して検索すると「Amazon DSSTNE Image」というのが出てくるので「Select」をクリックしてインスタンスを構築してください。

スクリーンショット 2016-05-24 午前2.53.09.png

AWSのインスタンスにSSHでログインする

ここは各々の方法でログインしてください。

ssh -i "dsstne-test.pem" ubuntu@ec2-server-id

DSSTNEのソースをcloneしてくる

#DSSTNEのソースを取得する
git clone https://github.com/amznlabs/amazon-dsstne.git

#DSSTNEのHOMEに移動
cd amazon-dsstne/src/amazon/dsstne

#mpiCCとnvccコンパイラへのパスを通す
export PATH=/usr/local/openmpi/bin:/usr/local/cuda/bin:$PATH
make
export PATH=`pwd`/bin:$PATH

これで環境構築は完了。AMIを用意してくれてるのでマジ簡単。

DSSTNEに使うデータの生成

#MovieLensのサンプルデータをダウンロード
wget https://s3-us-west-2.amazonaws.com/amazon-dsstne-samples/data/ml20m-all

ダウンロードしたデータの中身を見てみると、

head ml20m-all

=>
user_id movie_id,timestamp:movie_id,timestamp:…………

2   3,974820889:62,974820598:70,974820691:110,974820658:242,974820776:260,974821014:266,974820748:469,974820598:480,974820720:541,974821014:589,974820658:891,974820969:908,974820691:924,974821014:1121,974820598:1196,974821014:1210,974820598:1214,974821014:1249,974820691:1259,974820659:1270,974821014:1327,974820846:1356,974820598:1544,974820943:1580,974820748:1673,974820776:1748,974821014:1965,974820720:1969,974820969:1970,974820969:1971,974820943:1972,974820969:1973,974820916:1974,974820598:1986,974820969:2291,974820748:2454,974820916:2455,974820720:2791,974820659:2858,974820659:2948,974820659:2951,974820598:3150,974820720:3159,974820598:3173,974820869:3450,974820846:3513,974820659:3534,974820889:3555,974820748:3565,974820776:3703,974821014:3753,974820691:3917,974820720:3918,974820943:3923,974820943:3926,974820889:3927,974820748:3928,974820776:3930,974820943:3937,974820916:3959,974820659

ちょっとごちゃごちゃしてるので、表にすると、

user_id movie_id,timestamp movie_id,timestamp movie_id,timestamp ・・・
1 2,timestamp 29,timestamp 32,timestamp ・・・
2 3,timestamp 62,timestamp 70,timestamp ・・・

という感じで、user1がmovie2,29,32を評価したみたいなデータになっているようです。


次はダウンロードしたデータを、DSSTNEで読み取れる形式(NetCDF形式)に変換する。

#NetCDF形式に変換してインプットデータを生成
generateNetCDF -d gl_input -i ml20m-all -o gl_input.nc -f features_input -s samples_input -c

#NetCDF形式に変換してアウトプットデータの生成
generateNetCDF -d gl_output -i ml20m-all -o gl_output.nc -f features_output -s samples_input -c

生成したデータを学習させる

#dsstneの設定ファイルを取得
wget https://s3-us-west-2.amazonaws.com/amazon-dsstne-samples/configs/config.json.

config.jsonの中身は、こんな感じ。

スクリーンショット 2016-05-24 午後4.29.37.png

NNのパラメータや誤差関数、角層のノード数や活性化関数の設定などがJSON形式で記述されていて、ここがチューニングのしどころ。

設定可能なパラメータは以下に記載されているので参照しておきます。。

config.jsonを調整する方法

#学習させてモデルを生成する
train -c config.json -i gl_input.nc -o gl_output.nc -n gl.nc -b 256 -e 10

trainのログはこんな感じ。
スクリーンショット 2016-05-26 午前11.26.34.png

予測する

#生成したモデルを元に予測をする
#user_id毎に10個のmoviesをレコメンドしてくれる
predict -b 1024 -d gl -i features_input -o features_output -k 10 -n gl.nc -f ml20m-all -s recs -r ml20m-all

predictのログはこんな感じ。
スクリーンショット 2016-05-26 午前11.27.23.png

生成されたrecsというファイルがoutputデータになります。

#レコメンドデータを見てみる
more recs

データはこんな感じで表示されます。

recs.png

user_id movie_id,score:movie_id,score:…
という形で出力されて、scoreが高いものをレコメンドするイメージ。

まとめ

  • 大規模スパース(疎)行列データを使ってDeepLearningをしたいときには超絶便利なオープンソースだと思う。
  • グラフデータや行列データを持つ場合にはかなり使えそう

次にやってみたいこと

  • - config.jsonを色々いじってみたい
  • 実際のサービスに組み込んで精度を確かめてみたい
178
Help us understand the problem. What is going on with this article?
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
okappy
アトラエ取締役CTO兼yenta開発責任者やってます。 エンジニアの横の繋がりを大事にしたいので、何かあればfacebookで気軽にメッセージください。Qiitaの投稿に関することとかしないこととか、なんでもOKです。 http://www.facebook.com/toshi.oka.831
atrae
People Techカンパニーとして、転職サイトGreen, ビジネスマッチングアプリyenta, 組織改善プラットフォームwevoxなどのサービスを運営。全ての社員が誇りを持てる組織と事業の創造にこだわり、関わる人々がファンとして応援したくなるような魅力ある会社であり続けることを目指しています。

Comments

No comments
Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account Login
178
Help us understand the problem. What is going on with this article?