公共交通に関するオープンデータを探していたところ,第13回大都市交通センサスというデータがe-Statで公開[公開先link]されていることを知りました.
何か面白い分析できないかな~と思って,csvの中を覗いてみたところ......
全然わからん!意味わからん!
みたいな感じになってしまいました.
もちろんデータ処理に関する説明も公開されていたので,そちらも確認したのですが,
全然わからん.....意味わからん.....
著者の理解力が低いだけなら良いのですが,そうでない場合には,データを使いたい全員が困ってしまいます.
そこで,公開されているデータの説明から分かること/分からないことを整理しておこうと思います.
大都市交通センサスとは
大都市交通センサスは,こちらのページで,以下のように紹介されています.
昭和35年より5年毎に首都圏、中京圏、近畿圏の三大都市圏において、鉄道・バス等の大量公共交通機関の利用実態を調査することで、旅客流動量や利用状況(利用時間帯分布等)を把握するもの
2021年に実施された第13回調査では,第12回までの質問紙を配布する調査ではなく,ICカードデータを取得する調査になりました.
すなわち,第13回の調査データからは,関西圏,中京圏,首都圏における,ICカードを利用した鉄道によるトリップ,もしくはトリップチェインを把握することができます.
データは,0次OD表,1次OD表,2次OD表,3次OD表の4種類あり,特に0次と1~3次は全く異なるものです(なぜそんな関係ありそうな名前にしたんだ.....).
以下では各データの特徴を整理していきたいと思います.
0次OD表
このデータで分かること
e-Statに掲載されているデータの説明資料には以下のように記載されています.
0次ODとは、複数のICカード媒体毎の1日の改札機通過データを元に、個人が駅を出場した後に駅に入場するという、出場/入場の組み合わせを一組にしたトリップデータである。
公開データの詳細
データの説明資料に,csvのカラムの説明は入っていません.
ただし,データ処理段階の説明から察するに,各カラムは,
- 日付種別:この列はよく分かりません.
- 圏域:乗降エリアの情報(首都圏/中京圏/近畿圏)だと思われます.
- カード種別:利用されたICカードの種別だと思われます.
- 【入場】〇〇:入場した駅の情報だと思われます.
- 【出場】〇〇:出場した駅の情報だと思われます.※【出場】時間帯を除く.
- 【出場】時間帯:駅を出場した時間帯だと思われます.
- 滞在時間(5分単位):出場から入場までの時間で,単位は[分/人]だと思われます.
- 人数:出場/入場した駅と時間帯,滞在時間が同じである旅行者(ICカード)の人数だと思われます.
1次OD表
このデータで分かること
e-Statに掲載されているデータの説明資料には以下のように記載されています.
1次ODとは複数のICカード媒体毎の1日の改札機通過データを元に、入場/出場を一組にしたトリップデータである。
たとえば,下図のように,ある駅での入場から出場までの1トリップの出発駅(O)と到着駅(D)を把握できます.
公開データの詳細
データの説明資料に,csvのカラムの説明は入っていません.
ただし,データ処理段階の説明から察するに,各カラムは,
- 圏域:乗降エリアの情報(首都圏/中京圏/近畿圏)だと思われます.
- カード種別:トリップで利用されたICカードの種別だと思われます.
- 【入場】〇〇:入場した駅の情報だと思われます.※【入場】時間帯を除く.
- 【入場】時間帯:駅に入場した時間帯だと思われます.
- 【出場】〇〇:出場した駅の情報だと思われます.
- 所要時間(5分単位):入場から出場までの時間で,単位は[分/人]だと思われます.
- 人数:入場/出場した駅と時間帯,所要時間が同じである旅行者(ICカード)の人数だと思われます.
2次OD表
このデータで分かること
e-Statに掲載されているデータの説明資料には以下のように記載されています.
2次ODとは、複数のICカード媒体毎の1日の改札機通過データを元に、入場/出場を一組にしたトリップデータ(ただし、次のトリップまでの時間がある閾値時間以内の場合は同一トリップとみなす)である。
たとえば,下図のように,乗換を含む1トリップによる移動の傾向を把握できます.
公開データの詳細
データの説明資料に,csvのカラムの説明は入っていません.
ただし,データ処理段階の説明から察するに,各カラムは,
- 圏域:乗降エリアの情報(首都圏/中京圏/近畿圏)だと思われます.
- カード種別:トリップで利用されたICカードのしゅbだと思われます.
- 【入場】〇〇:入場した駅の情報だと思われます.※【入場】時間帯を除く.
- 【入場】時間帯:駅に入場した時間帯だと思われます.
- 【出場】〇〇:出場した駅の情報だと思われます.
- 所要時間(5分単位):入場から出場までの時間で,単位は[分/人]だと思われます.
- 経由情報:乗換駅として経由した駅に関する情報が入っていると思われます.
- 人数:入場/出場した駅と時間帯,所要時間が同じである旅行者(ICカード)の人数だと思われます.
なお,e-Statでは,2ji_15_1_1.csvや2ji_30_1_1.csv,2ji_60_1_1.csvのように複数のcsvが公開されています.
これらのファイル名の15や30,60は何分以内を乗換とするかのしきい値です(これは説明資料に記載あり).
3次OD表
このデータで分かること
e-Statに掲載されているデータの説明資料には以下のように記載されています.
3次ODとは、個人の一日の動きを1レコードとして出力したデータである。複数のICカード媒体毎の1日の改札機通過データから作成した、2次ODデータ(入場/出場を一組にしたトリップデータであり、次のトリップまでの時間がある閾値時間以内の場合は同一トリップとみなしている)を元に、各IDの入場/出場の組を一日分並べたトリップデータを作成する。
たとえば,下図のように,乗換を含む複数のトリップと駅での滞在をつなげたトリップチェインを把握できます.
公開データの詳細
データの説明資料に,csvのカラムの説明は入っていません.
ただし,データ処理段階の説明から察するに,各カラムは,
- Tr?-利用圏域:?番目のトリップの乗降エリアの情報(首都圏/中京圏/近畿圏)だと思われます.
- Tr?-カード種別:?番目のトリップで利用されたICカードの種別だと思われます.
- Tr?-入場〇〇:入場した駅の情報だと思われます.※Tr?-入場時間帯を除く.
- Tr?-入場時間帯:?番目のトリップで,駅に入場した時間帯だと思われます.
- Tr?-出場〇〇:?番目のトリップで,出場した駅の情報だと思われます.
- Tr?-所要時間5分単位:?番目のトリップの入場から出場までの所要時間だと思われます.
- Tr?-経由情報:?番目のトリップで乗換駅として経由した駅に関する情報が入っていると思われます.
なお,e-Statでは,3ji_15_1_1.csvや3ji_30_1_1.csv,3ji_60_1_1.csvのように複数のcsvが公開されています.
これらのファイル名の15や30,60は何分以内を乗換とするかのしきい値です(これは説明資料に記載あり).