0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

【R言語チュートリアル②】データフレームの利用

Last updated at Posted at 2023-10-15

はじめに

今回は、R言語によるデータフレームの利用についてのまとめです。

データフレームはR言語の中核で、構造化されたデータを効果的に格納・処理できるため、統計分析から可視化まで多くのデータ操作タスクで利用されます。この機能は異なるデータソースからの情報を結合・整理し、容易にアクセスできるため、データ解析や予測モデルの構築など、データ関連の作業において不可欠です。データフレームはデータサイエンスと統計分析の分野で特に重要な役割を果たします。

※今回は、動作確認のため自作した簡易的なデータフレームを使用しています。

データフレームを読み込む

データフレームを読み込む際には、read.csv()を使用します。

R
df = read.csv("sample.csv")

結果

R
> df
   age sex   weight   height
1   48   F 73.29791 182.3398
2   32   F 37.72677 176.3436
3   31   M 62.28208 174.1202
4   20   M 72.86549 177.9359
5   59   M 57.79488 168.4759
6   60   M 74.34550 167.7110
7   54   F 78.00177 160.9921
8   31   M 68.36069 162.6497
9   42   M 82.42919 155.7231
10  43   F 60.65615 176.1928

以下はコマンドと使用法です。

コマンド 使用法
read.csv(input_dir, header) データフレームを読み込む。
csvファイルだけでなくtxtファイルも読み込むことができる。
input_dir データフレームが保存されているディレクトリを指定する。
header データフレームに列名を記載するかを指定する。
(TRUE:列名あり、FALSE:列名なし)

データの抽出

列番号で指定する

データを抽出する際には、列番号を使用して抽出することができます。

R
> df[1]
   age
1   48
2   32
3   31
4   20
5   59
6   60
7   54
8   31
9   42
10  43

> df[2:4]
   sex   weight   height
1    F 73.29791 182.3398
2    F 37.72677 176.3436
3    M 62.28208 174.1202
4    M 72.86549 177.9359
5    M 57.79488 168.4759
6    M 74.34550 167.7110
7    F 78.00177 160.9921
8    M 68.36069 162.6497
9    M 82.42919 155.7231
10   F 60.65615 176.1928

警告
この場合、取り出されたデータはデータフレームになることに注意。



ベクトル化
ベクトルとして扱いたい場合は、以下のように,を加える、または$記法を使います。

R
> df[, 1]
 [1] 48 32 31 20 59 60 54 31 42 43

> df$age
 [1] 48 32 31 20 59 60 54 31 42 43 

行番号で指定する

データフレームから行単位で抽出したい場合は、以下のように実行する。

R
> df[1, ]
  age sex   weight   height
1  48   F 73.29791 182.3398

> df[3:6, ]
  age sex   weight   height
3  31   M 62.28208 174.1202
4  20   M 72.86549 177.9359
5  59   M 57.79488 168.4759
6  60   M 74.34550 167.7110

抽出条件を指定する

データフレームから、指定した条件でデータを抽出する際には、以下のように記述します。

R
> df[df$sex == "M", ]
   age sex   weight   height
3   31   M 62.28208 174.1202
4   20   M 72.86549 177.9359
5   59   M 57.79488 168.4759
6   60   M 74.34550 167.7110
8   31   M 68.36069 162.6497
9   42   M 82.42919 155.7231

> df[df$weight > 60 & df$height < 160, ]
  age sex   weight   height
9  42   M 82.42919 155.7231

> df[df$sex != "M" & df$age > 40 & df$age < 50 & df$weight > 60, ]
   age sex   weight   height
1   48   F 73.29791 182.3398
10  43   F 60.65615 176.1928



subset()を用いた抽出条件の指定
指定した条件でデータを抽出する際には、subset()を使用して以下のように記述します。

R
> subset(df, df$sex == "M")
   age sex   weight   height
3   31   M 62.28208 174.1202
4   20   M 72.86549 177.9359
5   59   M 57.79488 168.4759
6   60   M 74.34550 167.7110
8   31   M 68.36069 162.6497
9   42   M 82.42919 155.7231

> subset(df, df$weight > 60 & df$height < 160)
  age sex   weight   height
9  42   M 82.42919 155.7231

> subset(df, df$sex != "M" & df$age > 40 & df$age < 50 & df$weight > 60)
   age sex   weight   height
1   48   F 73.29791 182.3398
10  43   F 60.65615 176.1928
16  46   F 65.67870 166.2520

以下はコマンドと使用法です。

コマンド 使用法
subset(df, conditions) データフレームから条件を満たすデータを抽出する。
conditions 抽出条件。行単位だけでなく、列名を条件に加えることで
列単位で抽出することも可能。

データフレームを出力する

作成したデータフレームはwrite.table()を使用します。

R
output_df =  df[df$sex != "M" & df$age > 40 & df$age < 50 & df$weight > 60, ]

> output_df
   age sex   weight   height
1   48   F 73.29791 182.3398
10  43   F 60.65615 176.1928
16  46   F 65.67870 166.2520

read.table(output_df, "output_df.csv", append = F,sep = ",", row.names = FALSE, col.names = TRUE)

結果

R
#保存したoutput_df.csvを読み込む
> new_df = read.csv("output_df.csv")

> new_df
  age   sex   weight   height
1  48 F 73.29791 182.3398
2  43 F 60.65615 176.1928
3  46 F 65.67870 166.2520

無事、データフレームが出力されていることを確認できました。

まとめ

今回は、R言語によるデータフレームの利用についてまとめました。R言語はデータの統計や分析に使用されることが多いため、データフレームを気軽に扱える必要があります。加工したデータフレームを用いて、更なる分析やグラフ化をするなど、今回の学習内容はR言語の活用において重要な役割を果たします。

次はR言語を使用した線形モデルによる回帰分析をまとめていきたいと思います。

【R言語チュートリアル①】ベクトル、行列の四則演算
:準備中

0
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?