Edited at

RのフロントエンドExploratoryを使って、セクハラが世界中の「いつ、どの場所に」多いかを分析して、シリコンバレーのハッカソンで2位になってきた

More than 3 years have passed since last update.

今回のハッカソンには、テーマがいくつか用意されていた。例えば、教育、健康、金融、社会起業などがありました。中でも、ぼくの目を一際引いたのは、次のこの単語でした。

Safe City(安全な街)

以前、友人から、セクハラの相談を受けていたこともあり、セクハラの問題を解決するアプリによって「女性にとっての安全な街」を実装するを方針でぼくは動きました。チームは無事見つかり、ハッカソンに提供されていたセクハラのデータを集めたプラットフォームを運営しているSafe cityという非営利団体のAPIを利用したWebアプリケーションを作ろうということになりました。

セクハラは、


  • どこが多いのか?

  • いつが多いのか?

がわかれば、セクハラを撃退するアプリのアイデアの突破口になるかもしれないなと思い、Rのフロントエンドで話題のExploratoryを使って、軽く分析してみました。


1. スプレッドシートのデータをインポート

sekuhara-data.png

ぱっと見て、このデータが本当にセクハラのどういうデータなのかとかってわからないですよね〜。

こんな疑問を、データ分析によって簡単に解決することができるプロダクトがあります。それが、ぼくが今、留学先であるシリコンバレーで関わっているExploratoryというプロジェクトです。簡単に説明すると、コマンドラインインターフェイスで、データ解析とビジュアライズが同時に、柔軟にできるソフトウェアです。技術的に書くと、RのフロントエンドにNW.js (WebKitベースのデスクトップアプリSDK)とplotly.js (D3.jsベースの可視化ライブラリ)を用いた対話的で再現性重視のデータ分析環境を提供します。

このExcelのデータをExploratoryにインポートしてみます。

赤矢印のData Framesの隣の+アイコンをクリックして、Import Localデータをクリックします。

sekuhara-local.png

すると、どのデータタイプのデータをインポートするかを選べるので、Excelファイルを選びます。

sekuhara-excel.png

インポートしてきたデータが正しいことを確認して、Saveボタンを押します。

sekuhara-save.png

すると、さっきはエクセルでなんのことかわからなかったデータが、インポートしただけでわかりやすくなりましたね。

例えば、経度を表すLatitudeカラムなどを利用すれば、場所をビジュアライズしていくこともできそうです。

sekuhara-latitude.png


2. どの場所に多いか?

どの場所が多いかを見るために、チャート画面に行ってみましょう。ここで、チャートタイプをBarからMapに変えます。

sekuhara-map.png

LongitudeにLongitudeカラムを、LatitudeにLatitudeカラムを当てはまるだけで、簡単にどこがセクハラが多いかを見ることができます。

where-sekuhara.png

インドがダントツで多いですね笑


3. いつ多いか?

いつ多いかを見ていきたいので、曜日を表すカラムであるDATEに着目します。

いつ多いかを見たいときに、NA値があってもしょうがないので、消去します。

sekuhara-removena3.png

sekuhara-removena4.png

このままだと、セクハラが起きた日付がわかっても、何曜日なのかがわかりません。もしかしたら、日付より曜日に何らかの規則性があるかもしれません。Exploratoryだと、直感的に日付から曜日を計算することができるのでやってみます。

DATEカラムのヘッダーメニューからDay of weekを選びます。

sekuhara-day.png

すると、コマンドが自動的に入力されて、日付から曜日を出すことができました。

sekuhara-week.png

when-sekuhara.png

金曜日の午後にセクハラがダントツで起きていることがわかりました。


結論

お願いだから、インドの金曜日の午後に女の子1人で旅行するのだけはやめてください。


4. この分析を仲間とシェア

データ分析からセクハラについていろいろな知見を得ることができたので、ハッカソンの仲間にシェアして、データを基に、ブレストやディスカッションをしました。

Noteの隣の+アイコンを押すと、ブログを書くように分析の結果をメモしていくことができます。

sekuhara-note.png

分析中に使ったチャートを使うこともできます。

when-where-sekuhara.png

赤矢印の部分から、ネット上や仲間だけに公開することができます。

when-where-chart.png

when-where-blog.png

公開したことで、ハッカソンの仲間から、自分1人では決して気付かなかったたくさんの視点をもらえ、アイデアと実装に活かしていくことができました。

これから、いよいよ実装に入りました。


5. セクハラ統計アプリで2位に入賞

sekuhara1.png

ぼくたちが作ったセクハラ統計アプリは、簡単に説明をします。まず、地域の名前を検索すると、その地域の近くのセクハラの統計とレポートが表示されます。

sekuhara2.png

sekuhara3.png

それだけでなく、そのデータを元に、最も安全な道順(緑の線)を提示してくれます。

sekuhara4.png

自分がセクハラに会えば、その地域と時間帯を報告することもできます。

sekuhara5.png

sekuhara6.png

報告したときに、Twilioで近くの住所に登録しているユーザーに自動的に注意を促すSMS送信が来ます。

sekuhara7.png


結果

hackathon-win2.png

hackathon-win.png

詳しく知りたい方は、これがおれの2年だ!! 偏差値40高校出身のぼくがスタンフォードとUCバークレー大生限定のハッカソンに無理矢理参加して2位に入賞した話をどうぞ


興味を持っていただいた方、実際に触ってみたい方へ

Exploratoryはこちらからβ版の登録ができます。こちらがinviteを完了すると、ダウンロードできるようになります。

Exploratoryの日本ユーザー向けのFacebookグループを作ったのでよろしかったらどうぞ

ExploratoryのTwitterアカウントは、こちらです。

分析してほしいデータがある方や、データ分析のご依頼はhidetaka.koh@gmail.comまでどうぞ