0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

各テンソルのかたちと具体的なデータの種類を知ろう!

Posted at

はじめに

こんにちは!この記事では「テンソルのかたち」について、具体的なデータの種類に触れつつ、面白く分かりやすく解説していきます。テンソルと聞くと難しそうに感じるかもしれませんが、実は身の回りのデータもテンソルとして表現できるんです!数学的な概念としてのテンソルが、実生活のどんなデータに対応しているのか、具体例を交えて見てみましょう。

テンソルって何?

まず、「テンソル」という言葉の定義をおさらいしましょう。テンソルとは、簡単に言うと多次元配列です。
1次元配列(ベクトル)や2次元配列(行列)を、さらに高次元に拡張したものがテンソルです。Pythonなどのプログラミング言語では、NumPyやPyTorchのライブラリで扱えます。

次元ごとの具体例

1次元、2次元、3次元といったそれぞれの次元が何を意味するか、具体的なデータ例を見ていきましょう!


1. スカラー(0次元テンソル)

形状:()

これは単純に1つの数字を表します。0次元テンソルとは、いわゆる「スカラー」値です。
具体例:

  • 気温(25度)
  • 年齢(30歳)
import torch
# スカラーの例
scalar = torch.tensor(25)
print(scalar.shape)  # ()

2. ベクトル(1次元テンソル)

形状:(n)

1次元テンソルは、n個の要素からなるリストのようなものです。
具体例:

  • 生徒のテストの点数 [85, 90, 78]
  • 時間ごとの温度変化 [25, 26, 27, 28]
# ベクトルの例
vector = torch.tensor([85, 90, 78])
print(vector.shape)  # (3,)

3. 行列(2次元テンソル)

形状:(m, n)

2次元テンソルは、いわゆる「行列」です。表形式でデータを持つことができます。
具体例:

  • 画像のピクセル情報(白黒画像)
    例:[[255, 0, 0], [0, 255, 0], [0, 0, 255]] (3×3のグリッド)
  • 学校の成績表(各生徒の各教科の点数)
# 行列の例
matrix = torch.tensor([[85, 90, 78], [80, 75, 85], [90, 88, 92]])
print(matrix.shape)  # (3, 3)

4. 3次元テンソル

形状:(l, m, n)

3次元になると、データの層が追加されます。3次元テンソルは、複数の2次元行列が積み重なったような形になります。
具体例:

  • カラ―画像(RGB画像):3つのチャンネル(赤、緑、青)の情報を持つ
    例:(高さ, 幅, チャンネル) -> (256, 256, 3)
  • 動画データ:フレームごとに画像を持つ
# 3次元テンソルの例
tensor_3d = torch.randn(3, 256, 256)  # 3枚の256×256の画像
print(tensor_3d.shape)  # (3, 256, 256)

5. 4次元テンソル

形状:(b, l, m, n)

さらにもう1つ次元を増やすと、4次元テンソルになります。これは、例えばバッチ処理に使われるテンソルの形です。機械学習で、複数の画像やデータを一度に処理する場合、各データが3次元(高さ、幅、チャンネル)のテンソルであり、そのデータがバッチとしてまとめられると4次元になります。

具体例:

  • 複数の画像をまとめてバッチ処理
    例:(バッチサイズ, チャンネル数, 高さ, 幅) -> (32, 3, 256, 256)
  • 音声認識の入力データ(複数のサンプルごとに特徴量)
# 4次元テンソルの例
tensor_4d = torch.randn(32, 3, 256, 256)  # 32枚の3チャンネルの256×256画像
print(tensor_4d.shape)  # (32, 3, 256, 256)

テンソルの応用例

テンソルは機械学習やディープラーニングの基盤となるデータ構造です。画像処理、自然言語処理、音声認識など、さまざまな分野でテンソルが使われています。

画像認識

画像は通常、2次元または3次元テンソルで表現されます。白黒画像の場合は2次元(高さ×幅)、RGB画像の場合は3次元(高さ×幅×チャンネル)です。これを畳み込みニューラルネットワーク(CNN)に入力することで、画像のパターンや特徴を捉えます。

自然言語処理

単語の埋め込みや文の解析は、1次元や2次元テンソルとして表現されます。単語はベクトル(1次元テンソル)で表現され、文は単語の列として2次元のテンソルになります。

音声認識

音声データは通常、時間軸に沿った2次元または3次元のテンソルで表されます。特徴抽出を行うとき、複数の音声データをまとめて処理するために4次元テンソルが使われることもあります。


まとめ

テンソルはただの数の配列と思いがちですが、現実世界のデータを効果的に扱うための強力なツールです。今回紹介したテンソルのかたちや次元ごとの具体例を押さえておくことで、機械学習やディープラーニングをもっと身近に感じられるはずです!

テンソルを理解することは、データ処理やAIの世界で非常に役に立ちますので、ぜひ使いこなしてみてくださいね!

この記事が面白かったら、ぜひ「いいね」や「ストック」をお願いします!

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?