23
19

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

【mySQLでデータ分析】Sequel Proでデータベースを作ってみる。

Last updated at Posted at 2015-11-22

TwitterのAnalyticsとかfacebookのインサイトからデータをエクスポートしてきて、分析しようとしている。「10年戦えるデータ分析入門」という本に影響されて、やってみることに。まずは、mySQLをローカルで動かしてためしてみることにしました。

入れたもの

mySQLサーバを起動する

ターミナルで
mysql.server start

mySQLサーバを停止する

mysql.server stop

twitterのデータをインポートする

まずはSequel Proでテーブルを作る。この時、エンコーディングと、テーブル照合順序とテーブル型を聞かれる。テーブル照合順序がよくわからなかったので、ここでは参考URLをみてutf8_binを選択。
twitter_sequelreo_table.png

Twitter Analyticsからエクスポートしてきたcsvファイルを見ながらポチポチ手で作成。型とか長さとかそれっぽく適当に。
twitter_sequelpro.png

次にcsvファイルをSequel Proにインポートする。インポートは「ファイル」からできる。ここで問題発生。csvファイルのなかの「時間」の項目が曲者。中身が「2015-09-29 08:00 +0000」みたいになっていて、DATATIME型ではエラーが出る。
twitter_sequelpro_error.png

データを直す。Cod Editorでcsvファイルを開いて「検索」から「 +0000」を「」に置換する。
twitter_codeditor.png

もう一度csvファイルをインポートする。このとき、オプションでIGNOREをチェックしておく。このcsvファイルにはいろんな項目が用意されている。本来はint型のデータが入るべき項目に「-」とか入ってる場合がある。例えば、Twitterのプロモーション機能を使っている場合には「プロモーションのインプレッション」という項目には数字が入るが、その機能を使ってなければ「-」となっている。こういうのは今は気にしなくていいので、無視。
twitter_sequelreo_ignore.png

「内容」をクリックしてみると、ちゃんとインポートできていることが分かる。
twitter_sequelreo_imported.png

文字化けして見えるところもあるけれど、これはSequel Proの不具合のようで、データは正しく入っている。ちなみに、IGNOREをチェックしてインポートすると、「−」のところには「0」が入っている。

参考にしたもの

23
19
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
23
19

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?