More than 5 years have passed since last update.

SAS Viyaを使ったデータ分析入門

Posted at 2018-08-07

SAS Viya（サス・ヴァイヤ）はオープンなAIプラットフォームです。クラウドやオンプレミスで設置可能です。

今回はデモ版でデータ分析を試してみました。有名なタイタニック生存者のデータ、titanic_train.csvを使っています。

SAS Viyaの登録

時々英語になったり、ステップが多かったりしますが、登録作業自体は簡単です。

SAS Viyaにログインします。ユーザIDはメールアドレスを使います。

ログインすると表示される画面です。まずデータの管理を実行します。

使用可能なソースは最初は何もありません。

インポートを選んで、先ほどダウンロードしたCSVファイルを選択します。

テーブル名に .csv といった拡張子が入っているとインポートに失敗するので注意してください。

インポートされると列データやプレビューができます。

プロファイルを使って簡易的に分析もできます。

データの準備ではカラム名を変えたり、データの修正を行います。欠損値などがあれば適用したりするのに使います。

簡易的なグラフやデータ表示を行います。

データは先ほど取り込んだものを使います。

データによって自動的に集計行とラベル行に指定されていますので、必要に応じて変更します。

例えば性別別に生存者の数を見たりできます。

テキスト分析やデータマイニング、機械学習を行う機能です。

新しいモデルを作成します。データソースはもちろん先ほどインポートしたものを指定します。

そして変数やターゲット変数を指定します。

パイプラインを使って、ビジュアル的にデータマイニングの設定ができます。

ディシジョンツリーやツリーマップ、剪定誤差などを確認できます。

SAS Viyaは操作をビジュアルでできるので、開発者でなくとも使えるAIプラットフォームです。開発者向けにはREST APIも公開されていますので、それを使ってより深く掘り下げることもできます。

無償体験版も用意されていますので、ぜひ試してみてください！