IBM 土屋さん
- データサイエンスのコミュニティイベント
- 去年カリフォルニアから始まった
- みんなが主役になって、周りの人とコミュニケーション築いてね
- 終わってからコンペがあります:名刺分析構築
- 人工知能は名刺をどこまで解析できるのか
リクルートライフスタイル アナリスト 原田博植
わたし
- 日経新聞 データサイエンティストオブザイヤー2015
- シンクタンクでやってたこと
- 生体認証
- 指紋
- 音声
- 虹彩
- 指紋
- 顔
- 2010年当時精度が問題になってた
- 電子ペーパー
- 紙の代替物
- ICチップ
- スイカとかキャッシュカードとか
- 普及するかもわからんかった
- アンテナ内蔵のミューチップ
- コメよりちっちゃい!
- 生体認証
- このままっていいのか…危機感からネット分野へ流れた
- 髪やWebの媒体を見ている箇所のヒートマップ
- 基礎技術は、医療機器
- 手が動かせない、声が出せない人が、どこ見てるかを観測するデバイス
- 視線(感情)と言語(論理)の差分を観測
- ここから発展
- Googleグラス
- 店舗の商品陳列の最適化
- Googleグラス
- 世界中のいいねの例
- 営業いいね(建前)
- 実際の感情の近似化
市場
事例
- オーストラリアのおしゃれなマクドナルド
- オーガニック思考
- マックのロゴすら出さない
- リアルABテスト
- オンラインとオフラインを同じように考えると理解し易いかな
- 唾液からの遺伝子検査
- GoogleCWOお婦人のスタートアップ
- bioinformatics
- データを集めることに対する投資
- 健康状態モニタリング
- 毎朝ビタミン剤が調合されて出てくる
- コーディネートのパーソナライズWEB
- 毎日違う服装を提示
- いいと思ったら中に入る
- これを集計
- amazonの自動発注
- googlexrevisのコラボ
- ジーンズの扱いをロギングしてデータ収集
- アパレル店舗でのマーケティング
- 行動の言語化、近似化
- 迷っている時間や何を見ているか
- 声をかけて良いタイプかどうか
- などを収集
総括して
- 新しいデバイスもどんどんでてきていて、取れるデータはどんどん増えている
- データ集めていくが、どこまで取るべき?全部とりゃいいの?
- そうじゃないんじゃないかね。
実務
- データ分析
- グルーポン
- リクルート
- 経営戦略の横で術とぉ知る権限もらわんとしんどいかもね。
案件のスコープと攻守を明確にすること
リクナビNEXTリクルートエージェント / データベース概念検証
- 机と電話くれ的なね。
- hadoopを入れてデータ取りまとめたい!が、必要さがわかってもらえなかった
- 工数や終始計画やらを3枚の
リクナビNEXT
- 事業モニタリング環境改善
- データ内容が標準化されてない
- 課題
- hadoop見てる人がいたり、バックエンドのサブシステムを見ている人がいたり…
- データ鮮度や集計方法の違いで、報告数値がバラバラになってる
- 解決案
- データ内容の標準化
- みんなでhadoopに繋いだBIツールでデータを見る!
- データ内容の標準化
- 課題
- データ活用が高速化されていない
- 課題
- システム部がデータ出す
- 集計する
- とかとか。。。レポートするまでに数日
- 解決
- 自動化!
- 課題
- データへのアクセスがオープン化されていない
- [[写真]]
- データ内容が標準化されてない
Airレジ クライアントサポート体制改善
- スモールビジネスを早く始めるためのキットを提供する
- 地図上に営業の行動指標をマップ
- タブレットレジをどこでどれだけ使ってるか
- マイナスの理由(使いにくいとか)
- 使用状況を予測モデルを使ってピン化
- クラスタリング
- これらのデータをSalesforceとかと連携
リクルートAgent 重回帰分析による内定要因定量化
- 「採用成功方程式」
- 何やってるか
- エージェント、採用者、求職者
- 3方高望みの要件を、本当に必要なレベルまで調整していく
- こんなもんまでデータサイエンスでどうにかしていける
- [写真]
機械学習によるメール振り分け
- [写真]
- 自然語解析
- 形態素分割 頻度分布 単語出現率
- テキストマイニング
- カテゴライズ、
アソシエーションルールによる行動喚起
- [写真]
- 似た境遇の求職者同士をつなげていく「転職仲間」機能
- ずらし[写真]
業務のコストとインパクトを精査し合意形成と納得感の情勢をすること
- [写真]
- 基盤→運用→分析→施策
戦力構想を可視化
- 組織の体型
- 専門組織型
- システム部門型
- データの内容はよく知ってる
- 事業観点で見ているかは大事なポイント
- カスタマWeb型
- MP
- ハイブリット型
- 上記3つのデメリットを吸収して全部のせ
- すすめ方
- データマップ
- 業務運用しているデータたちを、どこに何を持ってるかでマップ * スキルマップ
- 人単位
- 横軸:お金で買える(採用)
- 縦軸:お金で買えない(社内知識やデータ知見)
- スキルスコア
- 組織単位
- 属人性のポイント化
- データマップ
最後に
- 赤の女王仮設
- 不思議の国ののやつ
- その場にとどまるためには全力で走り続けなければならない。
- natural selection
- ダーウィン
- 進化して、進化して、進化して、やっと現状維持。
- 仕事の報酬は仕事