0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

超入門初心者向け!統計解析に特化した"R言語"って?

Last updated at Posted at 2022-04-15

本記事では、超入門初心者向けに、そもそもR(アール)言語は何をするのに適しているの?何に役立つの?基本的な分析(ここでは散布図作成方法を紹介します。)をするのにどんなコードを書くの?などといった基礎的な疑問に答えていきます:open_hands:これからRを始めたい方、漠然とRに興味がある方におすすめです!!

R言語は、統計解析に特化したプログラミング言語で、分析をするために必要なパッケージを無料で使うことができます。1995年に開発され、現在までパッケージが追加され続けているため、最先端に近い統計手法を使うことができます:open_mouth:

しかしここで、そもそも"統計解析"ってなに?何のためにする必要があるの?と思っている読者さんもいらっしゃるかもしれません。簡単に例を用いて説明していきます!
"統計解析"とは、膨大な量のデータを分析して、データの特徴やパターンなどさまざまな視点から仮説を立てたり検証したりする方法です。仮説が立証され、物事の傾向や関わりを見つけることで、研究やビジネスの発展に貢献することができます!

具体的な例を見ていきましょう:point_right_tone1:
あなたは遊園地でアイスクリームを売っているとします🎢🍦アイスクリームの廃棄が多いと不利益に繋がるので、廃棄を減らし必要な分だけを入荷するためにアイスの売り上げをできるだけ正確に予測したい:bangbang:とあなたは考えました。こんな時に役に立つのが"統計解析"です!統計解析をR言語を使って行うには、まず日々の売り上げ、気温、天気、湿度、遊園地への来場者数、熱中症患者数など、アイスの売り上げに関係がありそうなデータを集める必要があります。そして、統計ソフトRにデータを読み込ませ、コードを書くことで、それぞれのデータがソフトクリームの売り上げと関係があるのか、また売り上げの予測をすることができます👍このように、Rを使いこなし、データに基づいた売り上げ予測ができれば、利益を最大化することができますね!!

実際に簡単な分析をRStudioというRを実行するためのアプリを使ってこの例を元にしてみましょう:point_right_tone1:
まずExcelに打ち込まれた以下のデータをRStudioに読み込んでデータ解析をすることにしましょう。RStudioは日本語がうまく認識されないことがあるので、ここでは、売り上げ(円)をsales、気温(度)をtemperature、来場者数(人)をattendanceとします。
Screen Shot 2022-04-16 at 18.21.27.png

ExcelファイルをRStudioで読み込むための便利な機能”read.csv()”があるので、今回はこの機能を使ってみましょう。(このように何か入力に対して処理を行ってくれるものを関数と言います。)この関数を使うには、まずExcelファイルをcsv形式でフォルダーに保存します。
Screen Shot 2022-04-16 at 17.07.36.png

そしてRStudioを開き、
Session→Set Working Directory→Choose Directory→csvファイルを保存したフォルダーを選択→Open の順に選択していきます。
Screen Shot 2022-04-16 at 16.22.10.png

Excelファイルの読み込み完了までもう1ステップです!
コードを書いていく中でExcelのデータを使うために
毎回"amusementparkdata.csv"と入力するのは手間がかかるので、
"amusementparkdata.csv"という名前を簡素化して、データをamusedataという名前で保存することにしましょう。そのためには、以下のように「<-」:代入演算子を使う必要があります。
Screen Shot 2022-04-16 at 18.22.22.png

コードを実行するためには、windowsではcontrol+R、macではcommand+return、または右上に表示されているRunをクリックする方法があります。
Screen Shot 2022-04-16 at 18.25.31.png

これでExcelファイルのデータ読み込みは完了です:smile:

それでは簡単な統計分析をして、気温と来場者数がそれぞれアイスの売り上げと相関関係があるのかみていきましょう!RStudioのコーディングの導入として、散布図を作成し、図から相関関係があるか考察をしてきます。
散布図を作成するコードは、X軸をアイスの売上、Y軸を気温とする場合、以下のようになります。
xlab、ylabはそれぞれX軸のラベル、Y軸のラベルを表しています。
Screen Shot 2022-04-16 at 18.27.30.png

そして以下に表示されているのが気温とアイスの売り上げについての散布図です。なんだか値がバラバラに散らばっていますね。
Screen Shot 2022-04-16 at 18.29.19.png

それでは同じように、X軸をアイスの売り上げ、Y軸を来場者数として散布図を作成しましょう!
Screen Shot 2022-04-16 at 18.28.48.png

散布図は以下のようになります。
Screen Shot 2022-04-16 at 18.29.49.png

来場者数が増加するにつれて売り上げも増加しているということが読み取れますね!
よって、アイスの売り上げには気温よりも来場者数の方が影響することが考察されます。

Rの導入解説は以上です!
この記事を通して、Rを使うとできることに対する皆さんの理解が深まれば幸いです:relieved:

参考文献
"統計解析とは何かをわかりやすく解説!主な活用例や役立つツールも紹介".マネケル.2021年9月30日.https://www.i-nobori.com/media/3113 .2022年4月15日

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?