この記事は、オープンデータをテーマにした、「オープンデータ Advent Calendar 2015」企画のための原稿です。2015年6月に第51回土木計画学研究発表会で発表した「オープンデータによるコミュニティバス基盤データの整備」の一部に大きく書き加えたものであり、初回のロンドン編、今回のアメリカ編、その後日本編と続く予定です。
#公共交通オープンデータの経緯
アメリカ合衆国における公共交通オープンデータのはじまりは、1998年にサンフランシスコ/ベイエリアの各地をつなぐ公営高速鉄道 BART (Bay Area Rapid Transit) がCSV形式でデータを公開したことだそうです(文献[1])。しかしよく知られているのは、2005年にオレゴン州ポートランドの交通事業者TriMetがGoogleと共同でデータ公開を開始した出来事でしょう(文献[2, 3, 4])。このプロジェクトは、TriMetの担当者であるBibiana McHughが2005年にGoogle Mapsへの情報提供を呼び掛け、それにGoogleの技術者であるChris Harrelsonが20%ルールを利用して応えたことから始まりました。2005年12月7日、Google Transit Trip Plannerが公開されました。これはGoogle Mapsの登場(同年2月8日)のわずか10ヶ月後ですね。この時に策定されたデータ提供フォーマットこそがGTFS(General Transit Feed Specification) です。翌年9月には、ホノルル、シアトルなど5都市の公共交通の対応が続くことになります。その後、リアルタイムの車両の位置を配信するGTFS-realtime仕様も策定されています。
こうした経緯で生まれたGTFSは、問題解決に熱意を持つ当事者が発案した、草の根から生まれたデータフォーマットとして評価されています。GTFS仕様策定の経緯は、Code for Americaによるオープンガバメントの教科書的な書籍「Beyond Transparency: Open Data and the Future of Civic Innovation (2013)」においても、Bibiana McHugh自らにより「Pioneering Open Data Standards: The GTFS Story」(文献[4])として一章を割いて紹介されています。
#公共交通オープンデータの現状
GTFSによって公開された公共交通オープンデータは、GTFS Data Exchangeなどにまとめられています。オープンデータを用いた公共交通利用支援アプリを紹介するWebサイトCity-Go-Roundによると、現在、864ある交通事業者のうち約29%である248事業者がオープンデータを提供しています。2012年に発表された文献[5]では、このあとの公共交通オープンデータが拡大する様子を以下の年表で示しています。2009年から2011年にかけて、各地の公共交通機関でのデータ提供が続いたこと、時刻表データに続いてリアルタイムデータの提供も進んでいることが分かります。文献[1]は、これ以降の重要な出来事としてニューヨークのMTAがバスの位置情報をGTFS realtimeとして配信開始した出来事を紹介しています。
また文献[6]は、GTFSによるオープンデータの拡がりを示す以下のようなグラフを紹介しています。2013年現在で、全米で998ある公共交通機関のうち272がオープンデータを公開しており(前掲の数字と少しずれていますが)、これは、乗客の乗車回数(Unlinked Passenger Trips, 途中で乗り換えた場合は加算して数えた総乗客数)に換算すると合計100億回のうちの89億回に当たるそうです。このグラフでも、2009年から2010年にかけて、大手の公共交通事業者によるオープンデータの公開が急激に進んだことが確認出来ます。
#データ形式、API仕様
データ形式を考える際には、時刻表や路線、駅やバス停情報など比較的変化が少ないスタティックデータと、GPSで取得したバスの走行位置などのリアルタイムデータとを分けて考える必要があります。前者はダウンロード出来るファイルとして、後者はAPIを通じて提供されることが多いようです。
スタティックデータの形式は、GTFSが一般的なようです。2012年に出版された文献[7]では以下の表を紹介していますが、同時にGTFSをデファクトスタンダードであるとも紹介しています。
GTFSのGはいまはGeneralの略とされていますが、当初はGoogleのGでした。その点を懸念する声があることを念頭に、文献[7]は以下のように書いています。
GTFSには事業者の要求(例えば、祝日ダイヤのような例外的な運行について情報提供を制限するような)を記述する機能がないために、それを必要悪だと考えるものもある。さらに、Google Mapsの利用に課金される可能性があるため、多くの交通事業者がそれに投資することに慎重である。しかしながら、GTFSは幅広く使われているので、多くのコミュニティのデフォルトであり、デファクトのデータ標準となった。もし新しい標準が現れたら、比較的簡単に、GTFSデータをその形式に変換できるようにする必要があるだろう。(拙訳)
リアルタイムデータの形式についてはGTFS-realtimeだけでなく、NextBus形式や、MTAやUTAに用いられているSIRIが形式などがあるそうです(文献[1])。
APTA(American Public Transportation Association)の2012年の調査(75事業者(24%)の回答)によると、1/3の事業者がリアルタイムデータのAPIを提供しており、一番多い形式がNextBus、ついでGTFS-realtime形式だそうです。
スタティックデータにおいては、80%の事業者が公開しており、GTFS形式が多数派となっています。
#公共交通オープンデータの効果や利用状況
文献[1]は、100本以上の文献調査と67社の事業者(アメリカ:50社, カナダ3社, ヨーロッパ14社, 回答率100%)へのアンケートを通して、公共交通オープンデータの実体や効果を調べています。その中から、私なりに気になった部分を紹介します。
-
オープンデータを公開する理由は、カスタマーサービスの向上、データアクセスの平等化の促進、革新的で多様なアプリの促進、事業者の透明性の確保、公共交通データは公共のものだという考えを支持するため、公共交通情報の流通を促進し幅広く届けるため、技術企業の支援、雇用の創出、高技能な労働力や財のコミュニティへの提供、イノベーションの促進、GTFSのような草の根の標準の促進、良い情報提供による乗客増と収入増、開発者のアプリケーション開発を容易に、乗客が時間を効率的に使えるように、交通データの提供でよりよい地域の意志決定など。(p.13)
-
オープンデータ提供に際して法的問題を気にする事業者はあり、ロゴなどの不当表示、データの正確性に関する問題、ホームページの広告収入の減少、情報コントロールが出来ない点などが挙げられる。しかしアンケート結果では、67事業者のうち実際に法的問題に直面したのは1社のみだった。(p.21)
-
BARTの担当者曰く、ライセンスは簡単にやさしく、たった258ワードしかない。(BARTのDeveloper License Agreement)(p.22)
-
GTFSの利用例を紹介する文献として文献[9]がある。ここで挙げている種別として「経路探索」「ライドシェア」「データ視覚化」「交通網の評価」「音声対話による案内システム」「リアルタイム交通情報」がある。(p.24)
-
文献中で目立つ応用事例のひとつはNextBus。これは、バスのリアルタイム情報から到着時刻を予想し乗客に届けるサービスであり、事業者のGPSデータから独自の技術で到着時刻を推測し、アプリやAPIなどで乗客に提供している。また事業者向けにバス運行を支援するサービスや、バス停などでの電光掲示などのサービスも行っている。アメリカを中心に135以上の事業者が導入している(NextBus Webページより)。NextBusにはバスの位置情報の他に基盤となす路線、バス停、時刻表といったデータが必要であり、ここにGTFSが使われている。(文献[9])バス1台に付き毎月20ドルという契約らしい。(p.55)以下の図は、How NextBus Worksに掲載されているNextBusの概要。
-
同じく応用事例に名前が挙がるOneBusAwayは、ワシントン州立大学の研究(CHI2010の論文)から始まったオープンソースによるバスのリアルタイム位置情報システムであり、現在はニューヨークのMTAのなどにも導入され、アメリカを中心にいくつかの都市で採用されている。GTFSはバス路線の基盤データとして利用されており、リアルタイムデータは、GTFS-realtimeだけでなく、SIRIなど様々なフォーマットに対応している。(文献[9])
-
OpenTripPlannerは、オープンソースによる、公共交通だけでなく自動車や徒歩などを含むマルチモーダルな経路案内システムであり、OpenStreetMapデータなどを利用するほか、公共交通データとしてGTFSに対応している。ポートランドのTrimetなどがWebサイトでOpenTripPlannerを経路案内サービスとして採用している(下図スクリーンショット)。OTP Analystという、OTPのエンジンを交通分析に利用するツールも提供している。
-
BARTでは、当初GTFS提供を社内の担当者によって1日かけずに行おうと検討し、これまで既存の時刻表データベースからGTFSに出力する機能のために費やした費用は通算で3,500ドルに満たない。別の文献では、小規模な事業者がGTFSを整備するのに3,000〜5,000ドル程度必要とされており、これと整合する。(p.30)
-
小規模な事業者のGTFS作成を支援するフリーなツールがいくつかある。例えばTransportation Research Boardの支援を受けたGoogle Transit Data Tool for Small Transit Agenciesなど。この流れは、現在Trillium Solutionsという、GTFS作成支援や乗り物の位置の可視化ツールの提供、コンサルティングなどを行う企業に続いているようである。(P.30および独自調査)
-
オープンデータの利点として、事業者だけでは開発できないアイディアやアプリが出てくるという効果だけでなく、事業者が、データを公開しない事業者と比べてより「オープン」で透明性が高いと見られること、革新的なサードパーティーが利用することで、事業者も革新的と思われる「ハロー効果」、データ品質確認のクラウドソーシング化などがある。(p.31)
-
オープンデータの推進のために、MTAやSEPTAはハッカソンのスポンサーになっている。(p.32)
-
開発者との関係は5段階で築く。(1)GTFSデータを公開し、GTFS Data Excahgeに登録する。(2)リアルタイムデータについても公開する。(3)Webにライセンスやデータなどを説明する「開発者ページ」を設ける。(4)アナウンスや質問などのための、開発者向けのメーリングリストやグループを作る。(5)Transit Developersグループにアナウンスする。(p.33)
-
事業者曰く「ほとんどの開発者は高い市民意識があり、乗客により良い情報を与えようとしている」「事業者と開発者は本質的には同じく乗客のために仕事をしており、開発者のためになることは、間接的に現在、未来の乗客のためにもなる」(p.33)
-
モスクワでは2012年にオープン/シェアデータを活用して公共交通網の大改良が行われた。携帯電話の位置情報データから需要を分析し、コストが掛かる鉄道の敷設よりバス路線の再編成を選択し、10億ドルのインフラ敷設コスト削減だけでなく朝の通勤時に1トリップあたり3分の時間短縮(1人1年で10時間に相当)を実現した。(p.34)
-
GTFSデータを内製するか外部委託するかは重要な決断であり、年数回ある時刻表改正に対して、継続的にGTFSが最新に維持される体制を作る必要がある。(p.35)
-
アンケート調査した67事業者のうち、57事業者(82.6%)がオープンデータを公開していた。そのうち8割以上が路線、時刻表、駅やバス停位置を公開しており、リアルタイムデータの公開は33事業者(58%)。どのデータをオープンにするかの理由としては、「技術的な容易さ」が一番多く、「他の事業者に倣って」「独自に決定した」が続く。GTFS形式での提供は47事業者(84%)。(pp.36-43)
-
アンケートを通した知見としては、(1)データの品質や正確さがオープンデータの成功のために重要。データは出すべきだがチェック可能な範囲で。(2)オープンデータは無料ではない。技術への理解や内部、外部スタッフの労力が必要。(3)データのオープン化は、顧客との向き合い方や組織内部の形など、事業者の内外を変える。(4)開発者との関係構築や支援が重要。何が必要か知り、素早く(開発者の時間感覚で)応えてゆく必要がある。
#発展途上国へも
交通データをオープンデータとしてGTFSフォーマットで公開するメリットは途上国支援の観点からも認識されています。発展途上国の交通情報をGTFSで整備し、既に開発されている様々なソフトウェアを活用しながら低コストで利便性の高い交通システムを実現しようという、GTFS for the rest of Usと題した活動が、世界銀行やコロンビア大学、MITなどの合同プロジェクトとして、マニラ、ナイロビ、ダッカなどを対象に行われています。
#私見
アメリカでは、交通事業者がデータをGTFS形式でオープンデータとして公開し、それを様々なサードパーティー企業が活用するという体制が根付いているようです。その背景としては、多くの都市の公共交通事業が、バスや地下鉄、地域の鉄道などが地域ごとに1社の公営企業で運用されていること、GTFSを内製できるくらいに事業者内部にIT担当者を抱えていること、日本の乗換案内サービスのような民間サービスがそれまでなかったこと、時刻表データを扱う企業がなかったことなど多くの点での日本との違いが挙げられると思います。Transportation Research Board (TRB)という日本の土木学会や日本学術会議に近い組織の活動が活発であることも特徴で、この文書の多くを依った文献[1]もここが出版したレポートです。また、バスのリアルタイムデータを提供するNextBus、OneBusAway、経路案内のOpenTripPlannerなどの事業やオープンソース活動も活発であり、データが活用され乗客に届き、公共交通の利便性が高まるというエコシステムが出来上がりつつあるように見えます。一方で、オープンデータの公開には事業者の努力が必要で、数の点では、まだ多くの小規模交通事業者がオープンデータに踏み切れていないことは日本と通じるところがあり、こうした事業者への支援をどのように進めるのか、興味深いところです。
#参考文献
- [1] Open Data: Challenges and Opportunities for Transit Agencies by Transportation Research Board of the National Academies, 2015
- [2] TriMet: Making a Difference - Bibiana McHugh: Open Data Evangelist
- [3] How Google and Portland’s TriMet Set the Standard for Open Transit Data
by Matthew Roth, 2010 - [4] Pioneering Open Data Standards: The GTFS Story by Bibiana McHugh, 2013
- [5] Transit Transparency: Effective Disclosure through Open Data by Francisca M. Rojas, 2012
- [6] Leveraging the General Transit Feed Specification for Efficient Transit Analysis by
James Wong, 2013. - [7] Getting Started with Open Data, A Guide for Transportation Agencies by Sarah M. Kaufman, 2012.
- [8] APTA Surveys Transit Agencies on Providing Information and Real‐Time Arrivals to Customers, by American Public Transportation Association, 2013.
- [9] The Many Uses of GTFS Data—Opening the Door to Transit and Multimodal Applications, 2013.