0.はじめに
各種の統計分析やデータサイエンスには欠かせない前処理、しかしいざ初めて見ると世の中にあるデータのほとんどが分析を始める前の処理段階で苦労するのが実際である。根性なしの私はここでやる気をなくしてしまうこと日常茶飯事。
そんな中、Qiitaのとあるサイトが目にとまってしまった。。。
1.神エクセルという命名が秀逸!
フェースブックで @higa4 さんの記事が出てきて、「神エクセル」というシニカルな表現が刺さったの素人ながらに完コピでやってみる。素人がこれだけを読むとできないので素人視点で必要な作業を並べてみた。またQiitaに初めて投稿をしてみたいという欲求にかられてしまったということもある(笑)
さて、まず記事を読んでみて、日本の統計データの多くが神エクセルだな~とあらためて実感。SSDSEのように教育用に整備をしてくれているファイルもあるが極々一部でありこれらのデータがもっと整備をされることで統計を行う人、そこから発見されることがもっと増えてくるのになというのが実感としてある。(ある意味社会問題じゃ!)
2.OpenRefineというツールのインストール
話は戻って、まずはなんかよさそうだけどOpenRefineというツールがあったことをしらなかった。いそいそとこのツールを調べ始める。Googleで入れると会社のサイト、、、出た!英語だけのサイト(ここですでに億劫になる)
あきらめないで検索をつづけると、このサイトをみつけた(Qiitaじゃないけど)。@Sakuraiさん 素敵!この順を追ってインストールの開始!
ちゃんとRDFのインストールができているかの確認を教えてくれているので素人の私も不安なし。
3.いざ神エクセルのダウンロード
さて、最初の神エクセルをダウンロードして、@higa4さんの流れに従って作業を開始してみることにします!
最初の投稿は、ここまで(汗) 次は完コピの流れにはいって素人の迷いを書いていきたいと思います。
各章の文字の大きさ変える方法とかがわかっていないのでテキストを書くだけになってしまってすみません。ここもこれからの勉強ということで。