0
2

海洋データ分析のためのSeabornとPythonチュートリアル

Posted at

はじめに

このブログでは、SeabornライブラリとPythonを使用して海洋データを視覚化する方法を20章に分けて解説します。各章には詳細な説明とサンプルコードが含まれています。

第1章: Seabornの基本

Seabornは、Pythonの強力なデータ可視化ライブラリです。Matplotlibをベースにしており、統計グラフの作成を簡単にします。この章では、Seabornの基本的な使い方を学びます。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd

# サンプルデータの作成
data = pd.DataFrame({'水温': [20, 22, 21, 23], '深度': [0, 10, 20, 30]})

# 散布図の作成
sns.scatterplot(x='深度', y='水温', data=data)
plt.title('水深と水温の関係')
plt.show()

この例では、水深と水温の関係を散布図で表現しています。Seabornのscatterplot関数を使用することで、簡単に美しいグラフを作成できます。

第2章: 海洋温度プロファイルの可視化

海洋温度プロファイルは、深度に対する水温の変化を示す重要なデータです。この章では、温度プロファイルを線グラフで表現する方法を学びます。

import numpy as np

depths = np.arange(0, 1000, 10)
temps = 20 * np.exp(-depths / 300) + np.random.randn(100)

sns.lineplot(x=depths, y=temps)
plt.gca().invert_yaxis()
plt.title('海洋温度プロファイル')
plt.xlabel('深度 (m)')
plt.ylabel('温度 (°C)')
plt.show()

この例では、深度が増すにつれて温度が指数関数的に減少する様子を表現しています。plt.gca().invert_yaxis()を使用して、y軸を反転させることで、深度が下に向かって増加するように表示しています。

第3章: 塩分濃度の等高線図

塩分濃度の空間分布を理解するには、等高線図が効果的です。この章では、Seabornを使用して塩分濃度の等高線図を作成する方法を学びます。

x = np.linspace(0, 100, 50)
y = np.linspace(0, 100, 50)
X, Y = np.meshgrid(x, y)
Z = np.sin(X/10) + np.cos(Y/10)

plt.figure(figsize=(10, 8))
sns.heatmap(Z, cmap='viridis')
plt.title('塩分濃度の等高線図')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.show()

この例では、仮想的な塩分濃度データを作成し、heatmap関数を使用して等高線図を描画しています。カラーマップ'viridis'を使用することで、塩分濃度の変化を視覚的に分かりやすく表現しています。

第4章: 海洋生物の分布ヒートマップ

海洋生物の地理的分布を可視化するには、ヒートマップが効果的です。この章では、カーネル密度推定を用いて生物の分布を表現します。

import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

# サンプルデータの作成
np.random.seed(0)
lat = np.random.uniform(-90, 90, 1000)
lon = np.random.uniform(-180, 180, 1000)
density = np.random.exponential(scale=1.0, size=1000)

data = pd.DataFrame({'緯度': lat, '経度': lon, '密度': density})

plt.figure(figsize=(12, 8))
sns.kdeplot(data=data, x='経度', y='緯度', weights='密度', cmap='YlOrRd', shade=True)
plt.title('海洋生物の分布ヒートマップ')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.show()

この例では、kdeplot関数を使用してカーネル密度推定を行い、海洋生物の分布を表現しています。カラーマップ'YlOrRd'を使用することで、密度の高い地域を赤く、低い地域を黄色く表示しています。

第5章: 海流の速度ベクトル図

海流の速度と方向を視覚化するには、ベクトル図が適しています。この章では、Matplotlibのquiver関数を使用してベクトル図を作成します。

import matplotlib.pyplot as plt
import numpy as np

# サンプルデータの作成
x, y = np.meshgrid(np.arange(-2, 2, 0.2), np.arange(-2, 2, 0.2))
u = -y
v = x

plt.figure(figsize=(10, 8))
plt.quiver(x, y, u, v, scale=50)
plt.title('海流の速度ベクトル図')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.show()

この例では、単純な渦巻き状の海流を表現しています。quiver関数を使用することで、各点での流れの方向と速度を矢印で表現しています。

第6章: 海洋深度プロファイル

海洋の深度プロファイルは、温度や塩分などの物理量が深さとともにどのように変化するかを示す重要なデータです。この章では、温度と塩分の深度プロファイルを同時に表示する方法を学びます。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
depths = np.arange(0, 1000, 10)
temps = 20 * np.exp(-depths / 300) + np.random.randn(100)
salinity = 35 + np.cumsum(np.random.randn(100)) * 0.01

data = pd.DataFrame({'深度': depths, '温度': temps, '塩分': salinity})

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 6))

sns.lineplot(x='温度', y='深度', data=data, ax=ax1)
ax1.invert_yaxis()
ax1.set_title('温度プロファイル')
ax1.set_xlabel('温度 (°C)')
ax1.set_ylabel('深度 (m)')

sns.lineplot(x='塩分', y='深度', data=data, ax=ax2)
ax2.invert_yaxis()
ax2.set_title('塩分プロファイル')
ax2.set_xlabel('塩分 (PSU)')
ax2.set_ylabel('深度 (m)')

plt.tight_layout()
plt.show()

この例では、温度と塩分の深度プロファイルを並べて表示しています。subplots関数を使用して2つのグラフを作成し、それぞれに温度と塩分のプロファイルを描画しています。y軸を反転させることで、深度が下に向かって増加するように表示しています。

第7章: 海洋生物の種類別分布

海洋生物の種類ごとの深度分布を理解することは、生態系の構造を把握する上で重要です。この章では、箱ひげ図を使用して種類別の深度分布を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
species = ['マグロ', 'サメ', 'イルカ', 'クジラ']
depths = np.random.normal(loc=[50, 100, 30, 20], scale=[10, 20, 5, 5], size=(1000, 4))
data = pd.DataFrame(depths, columns=species)

plt.figure(figsize=(10, 6))
sns.boxplot(data=data)
plt.title('海洋生物の種類別深度分布')
plt.xlabel('種類')
plt.ylabel('深度 (m)')
plt.show()

この例では、4種類の海洋生物の深度分布を箱ひげ図で表現しています。箱ひげ図は、データの分布、中央値、四分位数、外れ値を一度に表示できるため、種類間の比較が容易です。

第8章: 海洋汚染レベルの時系列分析

海洋汚染の経時変化を理解することは、環境保護の観点から重要です。この章では、時系列データを使用して海洋汚染レベルの変化を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
dates = pd.date_range(start='2020-01-01', end='2023-12-31', freq='D')
pollution = np.cumsum(np.random.randn(len(dates))) + 50

data = pd.DataFrame({'日付': dates, '汚染レベル': pollution})

plt.figure(figsize=(12, 6))
sns.lineplot(x='日付', y='汚染レベル', data=data)
plt.title('海洋汚染レベルの時系列変化')
plt.xlabel('日付')
plt.ylabel('汚染レベル')
plt.xticks(rotation=45)
plt.show()

この例では、4年間の日次データを使用して海洋汚染レベルの変化を線グラフで表現しています。lineplot関数を使用することで、時系列データの傾向を視覚化しています。

第9章: 海洋生物の体長分布

海洋生物の体長分布を理解することは、生態系の健全性を評価する上で重要です。この章では、ヒストグラムとカーネル密度推定を組み合わせて体長分布を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np

# サンプルデータの作成
fish_lengths = np.random.normal(loc=30, scale=5, size=1000)

plt.figure(figsize=(10, 6))
sns.histplot(fish_lengths, kde=True)
plt.title('海洋生物の体長分布')
plt.xlabel('体長 (cm)')
plt.ylabel('頻度')
plt.show()

この例では、histplot関数を使用してヒストグラムを作成し、kde=Trueオプションを指定することでカーネル密度推定曲線も同時に表示しています。これにより、データの分布形状を視覚的に理解しやすくなります。

第10章: 海洋酸性化の地理的分布

海洋酸性化は地球温暖化に伴う重要な環境問題の一つです。この章では、地理的な酸性化の分布を散布図で表現します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
lat = np.random.uniform(-90, 90, 1000)
lon = np.random.uniform(-180, 180, 1000)
ph = np.random.normal(loc=8.1, scale=0.2, size=1000)

data = pd.DataFrame({'緯度': lat, '経度': lon, 'pH': ph})

plt.figure(figsize=(12, 8))
sns.scatterplot(x='経度', y='緯度', hue='pH', data=data, palette='viridis')
plt.title('海洋酸性化の地理的分布')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.show()

この例では、scatterplot関数を使用して、緯度と経度に対するpH値の分布を表現しています。カラーマップ'viridis'を使用することで、pH値の変化を視覚的に分かりやすく表現しています。

第11章: 海洋生態系の食物連鎖ネットワーク

海洋生態系の食物連鎖を理解することは、生態系の構造と機能を把握する上で重要です。この章では、NetworkXライブラリを使用して食物連鎖のネットワーク図を作成します。

import networkx as nx
import matplotlib.pyplot as plt

# サンプルデータの作成
G = nx.DiGraph()
G.add_edges_from([
    ('植物プランクトン', '動物プランクトン'),
    ('動物プランクトン', '小魚'),
    ('小魚', '大型魚'),
    ('大型魚', 'サメ'),
    ('動物プランクトン', 'クジラ')
])

plt.figure(figsize=(10, 8))
pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True, node_color='lightblue', 
        node_size=3000, font_size=10, font_weight='bold')
plt.title('海洋生態系の食物連鎖ネットワーク')
plt.axis('off')
plt.show()

この例では、簡単な海洋生態系の食物連鎖を有向グラフで表現しています。spring_layoutを使用することで、ノードが適切に配置されるようにしています。

第12章: 海洋温度の季節変動

海洋温度の季節変動を理解することは、気候変動の研究や海洋生態系の理解に重要です。この章では、箱ひげ図を使用して月ごとの海洋温度の変動を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
dates = pd.date_range(start='2020-01-01', end='2023-12-31', freq='D')
temp = 20 + 5 * np.sin(2 * np.pi * np.arange(len(dates)) / 365) + np.random.randn(len(dates))

data = pd.DataFrame({'日付': dates, '温度': temp})
data[''] = data['日付'].dt.month

plt.figure(figsize=(12, 6))
sns.boxplot(x='', y='温度', data=data)
plt.title('海洋温度の季節変動')
plt.xlabel('')
plt.ylabel('温度 (°C)')
plt.show()

この例では、4年間の日次データを使用して、月ごとの海水温度の分布を箱ひげ図で表現しています。これにより、各月の温度範囲や中央値、外れ値を視覚的に比較することができます。

第13章: 海洋生物の種の豊富さと緯度の関係

生物多様性の緯度勾配は、海洋生態学の重要なテーマの一つです。この章では、緯度と種の豊富さの関係を散布図と回帰線で表現します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
latitudes = np.linspace(-90, 90, 100)
species_richness = 100 - (latitudes ** 2) / 100 + np.random.randn(100) * 10

data = pd.DataFrame({'緯度': latitudes, '種の豊富さ': species_richness})

plt.figure(figsize=(10, 6))
sns.regplot(x='緯度', y='種の豊富さ', data=data)
plt.title('海洋生物の種の豊富さと緯度の関係')
plt.xlabel('緯度')
plt.ylabel('種の豊富さ')
plt.show()

この例では、regplot関数を使用して、緯度と種の豊富さの関係を散布図と回帰線で表現しています。これにより、赤道付近で種の豊富さが最大になり、極地に向かって減少する傾向を視覚化しています。

第14章: 海洋プラスチック汚染の時空間分布

海洋プラスチック汚染は現代の重要な環境問題の一つです。この章では、ヒートマップを使用して汚染の時空間分布を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
years = np.repeat(range(2000, 2024), 5)
latitudes = np.tile(np.linspace(-90, 90, 5), 24)
pollution = np.cumsum(np.random.rand(120)) + latitudes / 10

data = pd.DataFrame({'': years, '緯度': latitudes, '汚染レベル': pollution})

plt.figure(figsize=(12, 8))
sns.heatmap(data.pivot('緯度', '', '汚染レベル'), cmap='YlOrRd')
plt.title('海洋プラスチック汚染の時空間分布')
plt.xlabel('')
plt.ylabel('緯度')
plt.show()

この例では、heatmap関数を使用して、年と緯度に対する汚染レベルの分布を表現しています。カラーマップ'YlOrRd'を使用することで、汚染レベルの変化を視覚的に分かりやすく表現しています。

第15章: 海洋生物の移動パターン

海洋生物の移動パターンを理解することは、生態学的研究や保全活動に重要です。この章では、極座標系を用いて生物の移動軌跡を可視化します。

import matplotlib.pyplot as plt
import numpy as np

# サンプルデータの作成
t = np.linspace(0, 10, 1000)
x = np.cos(t) * t
y = np.sin(t) * t

plt.figure(figsize=(10, 10))
plt.plot(x, y)
plt.title('海洋生物の移動パターン')
plt.xlabel('経度')
plt.ylabel('緯度')
plt.axis('equal')
plt.show()

この例では、螺旋状の移動パターンを描画しています。これは、多くの海洋生物が示す回遊パターンを模しています。axis('equal')を使用することで、x軸とy軸のスケールを等しくし、移動パターンを正確に表現しています。

第16章: 海洋深度と生物多様性の関係

海洋の深度によって生物多様性がどのように変化するかを理解することは、海洋生態学の重要なテーマです。この章では、散布図と回帰線を使用してこの関係を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
depths = np.linspace(0, 1000, 100)
diversity = 100 * np.exp(-depths / 200) + np.random.randn(100) * 10

data = pd.DataFrame({'深度': depths, '生物多様性': diversity})

plt.figure(figsize=(10, 6))
sns.regplot(x='深度', y='生物多様性', data=data)
plt.title('海洋深度と生物多様性の関係')
plt.xlabel('深度 (m)')
plt.ylabel('生物多様性指数')
plt.show()

この例では、regplot関数を使用して、深度と生物多様性の関係を散布図と回帰線で表現しています。これにより、深度が増すにつれて生物多様性が減少する傾向を視覚化しています。

第17章: 海洋生物の体長と体重の関係

海洋生物の体長と体重の関係を理解することは、生態学的研究や資源管理に重要です。この章では、散布図を使用してこの関係を可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
lengths = np.random.uniform(10, 100, 1000)
weights = 0.01 * lengths ** 3 + np.random.randn(1000) * 10

data = pd.DataFrame({'体長': lengths, '体重': weights})

plt.figure(figsize=(10, 6))
sns.scatterplot(x='体長', y='体重', data=data)
plt.title('海洋生物の体長と体重の関係')
plt.xlabel('体長 (cm)')
plt.ylabel('体重 (kg)')
plt.show()

この例では、scatterplot関数を使用して、体長と体重の関係を散布図で表現しています。これにより、体長が増加するにつれて体重が急激に増加する傾向(おおよそ立方の関係)を視覚化しています。

第18章: 海洋生態系のバイオマスピラミッド

海洋生態系のバイオマスピラミッドは、各栄養段階における生物量の分布を示す重要な概念です。この章では、棒グラフを使用してバイオマスピラミッドを可視化します。

import matplotlib.pyplot as plt

# サンプルデータ
trophic_levels = ['生産者', '一次消費者', '二次消費者', '三次消費者', '最終消費者']
biomass = [1000, 100, 10, 1, 0.1]

plt.figure(figsize=(10, 6))
plt.bar(trophic_levels, biomass)
plt.yscale('log')
plt.title('海洋生態系のバイオマスピラミッド')
plt.xlabel('栄養段階')
plt.ylabel('バイオマス (対数スケール)')
plt.show()

この例では、棒グラフを使用してバイオマスピラミッドを表現しています。y軸を対数スケールにすることで、各栄養段階間の大きな差を効果的に表示しています。

第19章: 海洋酸素濃度の鉛直プロファイル

海洋の酸素濃度プロファイルは、生物の分布や化学プロセスを理解する上で重要です。この章では、線グラフを使用して酸素濃度の鉛直プロファイルを可視化します。

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

# サンプルデータの作成
depths = np.linspace(0, 1000, 100)
oxygen = 8 - 7 * (1 - np.exp(-depths / 300)) + np.random.randn(100) * 0.5

data = pd.DataFrame({'深度': depths, '酸素濃度': oxygen})

plt.figure(figsize=(6, 10))
sns.lineplot(x='酸素濃度', y='深度', data=data)
plt.gca().invert_yaxis()
plt.title('海洋酸素濃度の鉛直プロファイル')
plt.xlabel('酸素濃度 (ml/L)')
plt.ylabel('深度 (m)')
plt.show()

この例では、lineplot関数を使用して酸素濃度の鉛直プロファイルを表現しています。y軸を反転させることで、深度が下に向かって増加するように表示しています。

第20章: 海洋生物の種間関係ネットワーク

海洋生物の種間関係を理解することは、生態系の構造と機能を把握する上で重要です。この章では、NetworkXライブラリを使用して種間関係のネットワーク図を作成します。

import networkx as nx
import matplotlib.pyplot as plt
import random

# サンプルデータの作成
G = nx.Graph()
species = ['マグロ', 'サメ', 'イワシ', 'クラゲ', 'イカ', 'タコ', 'クジラ', 'イルカ']
G.add_nodes_from(species)

for _ in range(10):
    species1, species2 = random.sample(species, 2)
    G.add_edge(species1, species2)

plt.figure(figsize=(10, 8))
pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True, node_color='lightblue', 
        node_size=3000, font_size=10, font_weight='bold')
plt.title('海洋生物の種間関係ネットワーク')
plt.axis('off')
plt.show()

この例では、8種類の海洋生物間のランダムな関係をネットワーク図で表現しています。spring_layoutを使用することで、ノードが適切に配置されるようにしています。

以上の20章を通じて、Seabornと他のPythonライブラリを使用した海洋データの多様な視覚化方法を学ぶことができます。これらの技術を組み合わせることで、複雑な海洋生態系のデータを効果的に分析し、表現することが可能になります。

0
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
2