整然データは、いわゆる「縦持ち」のデータで、定義は以下となります。
【1】各変数が1つの列で構成されている
【2】各観測が1つの行で構成されている
【3】各観測単位が1つの表で構成されている
データ分析や機械学習は、整然データのほうが扱いやすいことが多いです。
例えば、グラフを描画するPlotly Expressのcolor引数は、縦持ちのデータで指定する必要があります。
import plotly.express as px
px.line(
df,
x=df.index,
y='売上',
color='会社')
▶︎
color引数に「会社」の列を指定しているため、各会社で色分けされています。
次のような横持ちの雑然データの場合、color引数で色分けすることはできません。