はじめに
こんにちは。
CYBIRD Advent Calendar 2024 17日目担当の @kazurasaka です。
16日目は @alexa さんの「TyranoScriptのWKWebViewメモリー最適化とクラッシュ対策」でした。
TyranoScriptのメモリー消費増加によるクラッシュ問題に対しての解法、試行錯誤が見て取れます。
WKWebViewとCSSアニメーションの相性はいかんともしがたいですね。
それでは本日の内容と参りましょう。
肩肘張らずにさらっと読んでいただけるものをご用意いたしました。
概要
自分の知らない技術や新しい技術に触れておもろ、ってなるのが趣味です。
対戦よろしくお願いします。
それはさておき、ここ1〜2年新しいことやってないなーなんかしたいなーと思って、
今回は R言語 に触れてみました。
R言語とは?
統計解析に強みを持つインタプリタ型のプログラミング言語です。
インタプリタ型には PHP や Ruby や JavaScript なんかがありますね。
(余談ですが、名前が似ていたので R は Ruby のスーパーセットかと思ってました。全くの別物でした謹んでお詫び申し上げます)
統計分析仲間の Python くん
同じく統計分析によく使われるのに Python がありますが、これと R の大きな違いは 汎用性 です。
Webアプリなどは R では作れません。Python では作れます。
R は統計解析全振り。潔いね。
事前準備
R(言語)と RStudio(統合開発環境)を入れます。
入れ方は山のように転がってるので調べてください。
遊ぶためのデータはなんと R に100以上同梱されてます。親切。
もちろん自分で作っても構いません。
ヒストグラム図を描いてみる
df <- read.csv("sample.csv")
x = df$mike
hist(x, breaks=100)
これは自分で適当なデータを作ったバージョン。
dfは data frame の略です。分析でよく見るやーつ。
df$mike
で列指定してます。よく解らんけど他の列には kijitora
とか kuro
とかあるんじゃないですかね。
hist()
がヒストグラム図を描画する関数ですね。
基本これにデータ打ち込めば図が出来る。お手軽。なお動作も軽い。すばらしい。
事前データ整理
kaggleのときから思ってたけど、実際にコード書く前の分析データ整理のほうが何倍も何倍も時間かかるしだいたい8割ここに時間吸われるって言っても過言じゃない。
ここがきちんとできたらもう全部終わったくらいの気持ち。
分析手法が〜解析方法が〜とかそんなことより先にやることがある。
コード書くなんて最後の最後よ。
あと普通に統計学いるなって思いました。単位修めたの遥か彼方。勉強しよ。
ところで……
お気付きだろうか。
「解析」と「分析」の2単語が出ていることに。
表記揺れとか誤字ではないです。
分析
「物事を分類して細かな要素に分け、その性質や構造を明らかにすること」(広辞苑より)
解析
「ある事象を研究(探求)するのに理論的なアプローチがある場合」(広辞苑より)
データ分析によって収集したデータを分類し、データ解析によってそのデータ結果の原因を論理的に明らかにする
……という流れなんですねー。改めて調べたらそんな違いがあることにびっくりだよ。
最後に
分析入門とはタイトル詐欺の内容ですが、そもそもここ突っ込んで書いてる方が少ないので基礎の基礎の基礎というつもりで書きました。
ちゃんとした入門は他の記事や本を調べてね!!
明日の CYBIRD Advent Calendar 2024 18日目は、 @CR_ さんの記事です。
お楽しみに!