更新履歴
2020-10-20 第18回「ベイズ」追加
2020-11-05 第19回「CPELXの最適化」追加
2020-11-11 第20回 「スーパーノード」追加
2020-11-17 第21回 「シミュレーション」追加
2020-11-25 第22回 「拡張ノード」追加
2020-12-03 第23回 「自動分類」追加
2020-12-17 第24回 「エピローグ」追加
2021-04-27 2021年新シリーズ Modelerデータ加工Tipsのリンク追記
SPSS Modelerとは
データサイエンス・機械学習を目指している皆さん、SPSS Modelerをご存じでしょうか?
旧名称Clementineという製品であるSPSS Modelerは、すでに30年の歴史を持つ、データ分析、機械学習、データサイエンス全般をサポートしているソフトウェアです。その最大の特徴は、個々の処理を「ノード」と呼ばれる部品で実装し、ノード間を線で結合するというビジュアルプログラミングの発想で、複雑なデータ処理を実現している点にあります。
このソフトを使えば、PythonとかRとかといったプログラミング言語を勉強することなしに、データサイエンス・機械学習を行えるのです。
日本国内には、数多くのSPSS Modelerユーザーの方がいらっしゃるのですが、その中でも特にSPSSをディープに活用していただいているユーザー達に、AKBの選挙のごとく自分の「推しノード」を語ってもらうというのが、このシリーズの目的です。
皆様も是非、熱狂的な推しノードファン達の熱い語り口を読み取って下さい。
この企画を立案したのは私の同僚である西牧洋一郎さんです。このような素晴らしいコンテンツ作成をリードしていただいた西牧さんにはこの場を借りて御礼申し上げます。
SPSS Modelerの簡易版はIBM Cloudのクレジットカードなしのアカウントで、Watson Studioの1機能であるSPSS Modeler Flowとして利用可能です。こちらの簡単なガイドもqiita記事として別途アップしていますので、あわせてご参照下さい。
IBM Cloud(Watson Studio)設定手順
SPSS入門編
参考までにSPSS Modelerの画面例を以下にアップしておきます。
推しノード一覧表
回数 | ノード名 | タブ(グループ)名 | タイトル(記事リンク) | 著者 | 所属 |
---|---|---|---|---|---|
第1回 | - | - | SPSS Modelerノード総選挙結果をヒモトク | 岸代憲一 | IBM Data & AI TECH |
第2回 | ユーザー入力 | 入力 | 知られざる名脇役「ユーザー入力ノード」 で価格弾力性カーブを描いてみる | 西牧洋一郎 | IBM Data & AI TECH |
第3回 | データ検査 | 出力 | 予測の出来を左右するデータ理解の達人「データ検査ノード」で一気に俯瞰する | 神子島隆仁 | 荏原製作所 |
第4回 | 再構成 | フィールド設定 | ID付POSやIoT時系列データから特徴量を生成するスゴ技職人「再構成ノード」 | 河田大 | IBM Data & AI TECH |
第5回 | データ自動準備 | フィールド設定 | お助けロボ参上!?「データの自動準備ノード」があなたに代わって予測精度を上げる | 木暮大輔 | MAI |
第6回 | CHAID | モデル作成 | 絶対エース「CHAIDノード」流行りの機械学習を圧倒する伝えやすさと使いやすさ | 山下研一 | IBM Data & AI TECH |
第7回 | フィールド作成 | フィールド設定 | 新たなデータの道を切り開く、タフロードの俊足「フィールド作成ノード」 | 伴俊広 | 三菱自動車工業 |
第8回 | 異常値検査 | 出力 | ”いつもと違う”を見逃さない!凄腕検査官「異常値検査ノード」が異常を検知 | 牧野泰江 | IBM Data & AI TECH |
第9回 | RFM集計 | レコード設定 | 顧客データ分析の頼れる助さん&格さん「RFM集計ノード」「RFM分析ノード」 | 畠慎一郎 | SmartAnalytics |
第10回 | SMOTE | レコード設定 | 機械学習時代の申し子「SMOTEノード」が不均衡データの壁を突破する | 西澤英子 | IBM SoftwareService |
第11回 | TwoStep | モデル作成 | 文系データ分析者の強い味方「TwoStepノード」で店舗の見えない特性をあぶり出す | 鳥海淳一 | プラス |
第12回 | グローバルの設定 | 出力 | 裏方の魔術師「グローバルの設定」が統計値をキャッシュ!後続プロセスで利活用 | 守谷昌久 | IBM GBS |
第13回 | レコード結合 | レコード設定 | ストリーム領域のキーマン「レコード結合ノード」の秒で繋げる力と過信にご用心 | 櫛田弘貴 | スタッツギルド |
第14回 | 時系列 | モデル作成 | 過去の山や谷を捉えて幅でトレンドを先読みする勝負師「時系列ノード」の真骨頂 | 上田延寿 | IBM SoftwareService |
第15回 | 置換 | フィールド設定 | フィールドのマエショリスト「置換ノード」が魅せる凄ワザと関数@FIELDの威力 | 太宰潮 | 福岡大学 |
第16回 | データベース | 入力 | SQL魔法使い「データベースノード」がとどめの呪文で運用処理速度を向上 | 水谷 好伸 | IBM System Engineering |
第17回 | KNN | モデル作成 | 似た者探しの名人「KNNノード」(最近傍法)が気づかぬ隣人を言い当てる! | 田口 仁 | ADKマーケティング・ソリューションズ |
第18回 | ベイズ | モデル作成 | 隠れた関係を見つける名探偵「ベイズノード」が変数間の因果構造を解き明かす | 小林竜己 | IBM GBS |
第19回 | CPLEXの最適化 | レコード設定 | 最強のラスボス「CPELXの最適化ノード」が予測の次の最終ステージで実力を解放 | 近澤喜史 | 日本情報通信 |
第20回 | スーパーノード | N/A | ストリームを変幻自在に整頓活用する超人「スーパーノード」の神業パラメータ処理 | 坂本康輔 | IBM Data & AI TECH |
第21回 | シミュレーション | 出力 | リスク博士「シミュレーションノード」がシナリオ別に示す臆病と強気の境界線 | 木田浩理 | 三井住友海上火災 |
第22回 | 拡張ノード | レコード設定 | 一流エージェント「拡張ノード」。必要なタレントは外から連れてくれば良い! | 千代田真吾 | IBM Data & AI TECH |
第23回 | 自動分類 | モデル作成 | 機械学習の多重奏!名指揮者「自動分類ノード」が織りなす至高のアンサンブル | 林啓⼀郎 | AIT |
第24回 | エピローグ | N/A | リレー完結!解説と振り返り | 京田雅弘 | IBM Data & AI TECH |
2021年新シリーズ
Modelerデータ加工Tips