オープンデータ標準を作る: GTFS物語

  • 45
    いいね
  • 0
    コメント

この文章は、オープンガバメントに向けた取り組みのいわば教科書として刊行された「Beyond Transparency -- Open Data and the Future of Civic Innovation --」(2013年、Brett Goldstein, Lauren Dyson編)の10章に収録された「Pioneering Open Data Standards: The GTFS Story」を翻訳したものです。日本においても、公共交通オープンデータの取り組みが少しずつ盛り上がってきた現在、従来の企業の枠を越えた取り組みの一例として参考になるのではないでしょうか。

著者のビビアナ・マッキュー氏は、オレゴン州ポートランドの公共交通事業者であるTriMet(トライメット)のIT部門に勤務しており、Googleと共同で2005年にGoogle Transitを実現します。この過程で、GTFSという公共交通オープンデータの標準規格や、公共交通事業者が、オープンデータとしてデータを公開するというムーブメントそのものを生み出しました。

原文は英文で書かれており、CC BY-NC-SA 3.0でGitHub上で公開されています。この規程に従って、この翻訳文章に関しても同様にCC BY-NC-SA 3.0で公開することとします。


オープンデータ標準を作る: GTFS物語

著者: ビビアナ・マッキュー (Bibiana McHugh)
翻訳: 孕石直子

2005年、私はオレゴン州ポートランドの公共交通機関、トライメット(TriMet)で地理情報サービスのITマネージャーをしていた。その年の初め、旅行をしていた私は、慣れない町で目的地まで公共交通機関を使った行き方を探すというのはとても大変だということに気付いた。これは、異なる種類の交通機関を利用したり地域をまたいだりする場合に特にそうだった。当時はインターネットの地図サービスを使って車での行き方を検索する方がはるかに簡単で、私は恐らくそれが、公共交通よりも自家用車が利用される原因になっているのではないかと思った。

トライメットでの仕事の中で、私は毎日交通データを扱っていた。だからそういうデータの利用は可能で、可能性はそこにある、ということは分かっていた。多くの交通機関がそうであるように、トライメットも、自社のホームページで乗換検索ができるようになっていた。しかし問題は、一般の人はこういった情報がどこにあるのか分からないということだった。特定のウェブサービスを使って車での経路を検索することは一般に普及していた――当時はグーグルマップ、マップクエスト、ヤフーが広く使われていた――しかし公共の交通機関を利用した移動を計画するのに必要なデータは、そういったサイトにはなかった。

データを一般の人に届ける

公務員として公共交通の向上のために10年近く働いてきた私は、これを、これまで見過ごしてきたチャンスだと捉えた。公共交通という選択肢に気付かない人々の利用を促すチャンスである。ポートランドに戻った私は、世界中のどこからでも、公共の交通機関を使った目的地までの行き方を、車での行き方を調べるのと同じくらい簡単に調べられるようにしようと決意した。私は何社かの企業に連絡を取り、ユーザが公共の交通機関を使った移動を計画できるよう、彼らのナビゲーションサービスにポートランドの公共交通のデータを入れたいと問い合わせた。

再三の問い合わせにも企業からは返事がなかった。そんな中、私は「求む、オープンソース公共交通マッピング」(Faludi, 2005)という記事を読み、著者のジェレミー・ファルディ氏に連絡を取った。ファルディ氏は私を、私と同じ考えを持つグーグルのソフトウェアエンジニア、クリス・ハレルソンに紹介してくれた。クリスは自身と志を同じくする同僚とチームを作り、社内の20%自由プロジェクトタイムを利用して、グーグルトランジットのプロトタイプの構築に取り組んでいた。彼らにはアイディアと開発のための基盤があった。プロジェクトを進めるために彼らが必要としていたのは、彼らに協力し、ルートや時刻表など、サービスのデータを提供してくれる行政機関だった。

2005年7月、私たちはプロジェクトについて話し合うためにグーグルのチームと会った。トライメットの社員の中には、当初、データを渡すことをためらう者もいた――非常に複雑な時空間データで、正しく扱うのが難しいからだ。しかしクリスのチームが全て理解して作業するのを見て、私たちはとても感心した。トライメットの最高技術責任者、ティム・マッキューは、その夜のうちに最初のデータ出力を行った――後に一般に広く使用される初の交通機関データ標準となるもののベータ版である。

トライメットには現行の集中型の企業データベースがすでに導入されていて、その中には関係する全てのデータが保存され、データ同士は正しく関連づけられていた。この土台が整っていたことに大きな意味があった――これがあったからこそ最初のスクリプトを1時間足らずで書け、公共交通機関を使った移動を計画するために必要なデータをエクスポートすることができたのだ。私たちはこのスケジュールデータをトライメットの内部データベース・スキーマに基づいたCSVファイル形式で公開し、グーグルと共有するとともに、外部のソフトウェア開発者の誰でもアクセスし使用できるように、トライメットのウェブサイトでも公開した。

もう一つの重要な要素は、トライメットの上層部が実験を進めることに協力的だったことである。専務取締役のキャロライン・ヤングは、私たちが構想を得てすぐにデータをオープンにすることを許可してくれた。これはトライメットにオープンソースやオープンデータを支援してきた長い歴史があったおかげだった。トライメットのトランジットトラッカー(次の到着時刻)フィードはすでにオープンで、外部のソフトウェア開発者はすでにトライメットのオープンデータを2005年より以前から使用していた。トライメットではオープンソースに理解のある調達ポリシーが10年前から整っていた。トライメットの文化として、こういうタイプの新たな取り組みを支援する環境ができていたため、私たちはすぐに動くことができた。

2005年12月7日――私たちが初めて顔を合わせてから5ヶ月にも満たないうちに――ポートランド・メトロ地域をカバーするトライメットのデータを用いた、グーグルトランジットの最初のバージョンが発表された(Garg, 2005)。発表には想像以上の好反応があった。グーグルトランジットが稼働を始めると、口コミで最初にヨーロッパ全土に伝わった。サイトのアクセス数が急激に伸びていくのを、グーグルトランジット・チームは、驚きを持って見つめていたという。アメリカが朝を迎える頃には、アクセス数はグーグルの水準からしても驚くべき数字になっていた。

グーグルトランジット発表当日、私は、地方テレビ局や新聞社、それにラジオ局からも、数え切れないほどのインタビューを受けた。自分たちは何か重要なこと――皆が関心を持つようなこと――をしているのだと感じた。そして、グーグルトランジットをポートランドの外へ広げるため、他の事業者も参加させなくては、と思った。

拡大

他の事業者や開発者にもデータをオープンにし標準化することに協力してもらおうと、私たちはグーグルトランジットのベータ版発表の直前にワークショップを開いた。多数の交通事業者が参加していた。その中にはシアトル市やシカゴ市、ニューヨーク市もいた。しかし多くの事業者は消極的だった。共通の懸念は、オープンな標準フォーマットでデータを渡すことは事業者の利益にはならず、グーグルの利益にしかならないのではないか、ということだった。

しかしこの態度は、グーグルトランジットを発表し、それに対する一般ユーザの反応を見た途端に変わった。事業者はこれに加わることが有益だと見たのである――単に宣伝効果があるというだけでなく、ユーザからはっきりと求められているサービスを提供できるという意味で。担当の責任者たちから「自分たちも加わるにはどうしたらいいか」という電話が次々とかかってくるようになった。

他の市へ拡大するために重要だったことは、交通事業者がそれぞれの運行スケジュールのデータを標準化して公開することで、サードパーティーのアプリでは、交通事業者の区域を越えて同じやり方でデータを結合できるということだった。私たちはグーグルと、他に関心を持ってくれたいくつかの事業者と協力し、標準フォーマットの構築に取り組んだ。これが当時「グーグルトランジット・フィード・スペシフィケーション」(GTFS)と呼んでいたもので、トライメットが公開した最初の一連のデータが元になっている。

ファイルはCSV形式のままにすることとした。事業者が簡単に、かつどのエディタでもデータを編集できるよう、できるだけシンプルなものにしたかったのである。これは多くの批判を呼んだ。「技術的に古く脆弱」(KiZoom, 2006)とさえ言われた。しかし私たちにとっては、資金の潤沢でない零細の事業者でも参加できるよう、垣根を低くしておくことが重要だった。グーグルトランジット・チームメンバーのジョー・ヒューズもGTFSディスカッション・リストの最初の挨拶でこう言っている:

私たちは仕様の基礎にCSVを選びました。表計算ソフトやテキストエディタで簡単に閲覧・編集できるため、小規模事業者でも使いやすいからです。またほとんどのプログラミング言語やデータベースから素直に生成できるため、大量のフィードを公開する場合にも便利です。(Hughes, 2007)

2006年9月、グーグルトランジットは、初期の標準フォーマットで新たに交通データの公開を開始した、タンパ、ホノルル、ユージーン、オレゴン、ピッツバーグ、シアトルの5市で使えるようになった。それから間もなく、私たちは、クリエイティブ・コモン・ライセンスでGTFSの最初のバージョンを公開した(”What is GTFS?” 2012)。

1年もしないうちに海外にも広がり、新たにアメリカと日本の14の事業者がグーグルトランジットに加わった。2013年7月現在、グーグルトランジットは世界中の何百もの市に対応している(”Google Maps: Transit: Cities Covered,” n.d.)。アフリカ、アジア、ヨーロッパ、北アメリカ、南アメリカで、車でのルートに加え、公共の交通機関でのルートがグーグルマップ上で検索可能である。

2007年の初め、トライメットを含むいくつかの交通事業者が、情報提供の専用サイトを開設し、開発者向けにより正式な形で交通データのオープン化と公開を始めた。トライメットとサンフランシスコ・ベイエリアの地下鉄、BART(Bay Area Rapid Transit)が最初の事業者で、有益性が明らかになるにつれすぐに他の事業者も続いた(”Developer Resources,” 2013; “For Developers,” 2013)。

ソフトウェアの開発はトライメットの本業ではない。しかし自社のデータをオープンにすることで、我々は外部資源を生かすことができ、一般の人々の役に立つことができた。交通データを公開しソフトウェア開発者たちと協力することで、トライメット利用者や他の多くの人々の役に立つ人気の交通アプリが生まれた。ほとんどがサードパーティーが独自に開発したものだ。創造的で役に立つ多種多様なツールがあり、様々なユーザに合わせて複数のプラットフォーム上で利用可能である。ティム・マッキューに、なぜトライメットのデータをサードパーティーの開発者に公開することに積極的だったのか尋ねると、彼はこう説明した:

モバイルプラットフォームでの交通アプリの大きな広がりによって、市場は変化に迅速に反応し、サービスの不足を補うことができるようになった。1つの行政機関のIT部門では、このような自発性と柔軟性を持って開発したり、サポートしたりすることは不可能だった。(McHugh, 私信, 2013)

オバマ大統領がおこなった最初の政策の1つがオープンガバメント政策だった(”About Open Government” 日付不明)。これにより、オープンデータとオープンソースソフトウェアを支えるために、ソフトウェア開発者のためのリソースでありアプリケーションのためのリソースであるData.govが生まれた。この運動は多くの市や州、国々に広がり、国民に多くの利益をもたらした。交通ですでにデータのオープン化をしていた我々は、これに速やかに対応することができ、この新しい機運を初めから味方につけることができた。

オンライングループやフォーラム、メーリングリストに加え、GTFSデータ・エクスチェンジ(www.gtfs-data-exchange.com)のようなサイトが現れてこの標準に関するコミュニティーを作り、業界で広く使われるようになった。GTFSのサポートやメンテナンスを提供する企業が、足りない部分を補い、重要な役目を果たし始めた。GTFSがビジネスになり、金になり始めたのだ。

なぜ標準(スタンダード)が重要なのか

GTFSの取り組みが成功したのにはいくつかの重要な要素があると思っている:

  • 小規模の共同チームで、非常に具体的な目的を持って始めたこと。
  • 交通データの仕様をオープン・スタンダード(標準)として公開したこと。仕様もフォーマットも簡素だったこと。
  • 参加交通事業者や民間パートナーに対する具体的なビジネスインセンティブがあること。
  • 世界中のユーザが関わり、貢献してくれたこと。

交通事業者にとってGTFS標準に参加することの最大の利点は、日々何百万、何千万もの人々が利用する、国際的で使いやすい検索サービスに自社の情報が載るということである。その街について詳しくない旅行者や、単純にそういった交通手段の存在を知らない人の役に立ち、自家用車以外の移動方法を見つける手助けになる。普段公共交通を利用している人も、自分がいつも使っている慣れた画面で他の欲しい情報とともに交通情報を確認することができるようになる。大切なのは、人々により良い情報とサービスを提供することだ。そして事業者の役割とは究極的にはこれに尽きる。

この全てが低予算で叶う。トライメットでは処理は自動化されているため、費用はほとんどかからない。トライメットでは小さな変更や調整の他に、大きなサービス変更が年に4回ある。GTFSデータは1カ月に2回更新しているが、これにかかる直接の費用は自社での更新作業以外にない。その更新作業も、それによって得られる利益を考えれば比べるべくもない。

事業者がGTFSをオープンデータとして自由に利用可能にした今、世界中で大量のソフトウェアやアプリが生み出されている。我々は、自分たちがデータをオープン化し簡単に使えるようにすれば、開発者たちはもっともっと様々なアイディアを生みデータの使い方を広げてくれるのだということに気がついた。これは提供する製品やサービスの数を充実させるというだけでなく、開発者や彼らの住む地域にとって新たな経済的利益を創出することにもなる。また、標準のおかげで異なる市の間で相互運用が可能なため、ある市のために構築したアプリケーションでもすぐに他の市で使えるようにすることが可能である。費用も労力もデータが標準化されていない場合と比べてずっと少なくて済む。

GTFSの採用にあたり、初期の頃には、交通事業者が自社のGTFSデータに対し料金を請求するという案もあった。しかしすぐに、データの売り上げで得られるだろう利益よりも投資利益率の方がはるかに高いことが明らかになった。それに情報公開請求への対応を考えると、事業者がたくさんの要望に個別に対応するよりも、求められているデータをオープン化し利用可能にする方が良いと気づくことになった。開発者の中にはデータを交通事業者のサイトからスクリーンスクレイピングするという手を使う者もいたが、それでは利用客向けの最新の正確な情報にアクセスできるとは限らず、あまり良い方法ではなかった。標準フォーマットでのオープンデータを提供することが、人々にとって一番良いということは明らかだった。

拡張性のある標準のために分かったこと

市民発のデータ標準は公共交通分野に限ったものではない。データは公共サービスのどの面においても核となる要素で、標準が役に立つ機会はいくらでもある。例えば最近では、行政へ困り事を報告できる標準フォーマット「Open311」、飲食店調査データのフォーマット「LIVES」、家屋調査データの標準「House Facts」などの取り組みがある。私たちがGTFS開発で得たものは、真に拡張可能でオープンな都市のデータ標準作りに役立つのである。

GTFSの成功のカギを握ったのは、実際の事象に即して作ったということだ。私たちは現実に起こっている問題を目の当たりにし、それをデータで解決した。標準が実際の問題とはっきりと結びついていたため、私たちはGTFSを採用した際の投資利益率を現実的に予想し明示することができた。それを採用することによってそれぞれの事業者にどのようなメリットがあるのか、しっかりと考えることは大変重要である。また、黎明期に事業者の参加を後押しするためには、広告効果を侮ってはいけない。一般的に公共事業者は、何か問題があった時には報道され、良い時には全く報道されないという状態に慣れている。良い取り組みについてメディアで好意的に取り上げられれば、強いモチベーションになる。そういった意味で、トライメットがグーグルトランジット始動で全国的に注目を浴びたのは、とても大きなことだった。

全国的に有名な企業と協力してデータを統合することは、成功への大きな勢いとなる。グーグルと協働したことで、私たちの仕事の価値の大きさをすぐに示すことができ、またグーグルのブランド力を背景に世間の注目を集めることができた。世の中ですでに広く使われているグーグルの製品に統合することで、すぐさま全国、そして世界にも対応したサービスであることを示せた。

一方で、オープン標準を企業パートナーのブランドにしてしまうことは避けるべきである。私たちは外部のオープンソース開発者たちに標準に沿ってアプリを開発してもらったり、交通データサービス提供企業と協力関係を結んで標準に準拠したエクスポート機能を顧客に提供しようとしたりして、反発に遭った。事業者は自社のデータをグーグルだけに渡していると思われることに不快感を示し、開発者は「グーグル」という名前の付いた標準に基づいて開発することに抵抗を示した。それで我々は名称をグーグル・トランジット・フィード・スペシフィケーションからジェネラル・トランジット・フィード・スペシフィケーションに変更した。その効果は大きく、ソフトウェア・ベンダーや既存の交通データ標準の支持者、公共のデータを整理して転売する企業、そして自分たちのデータに対して支配権を失うのではないかと危惧する交通事業者からの反発が格段に減った。

標準の拡張性と中立性には、全国的に有名な企業との協働に加え、他の開発者やパートナー(市民のハッカー、他の都市、大手ベンダーなど)の関与が極めて重要である。そのために柔軟に対応し、他の組織やアプリケーションをサポートしていくことが肝要である。

GTFSが比較的すぐに世界中のプラットフォームで採用されたのも驚異的だが、世界中で自主的に採用されたと思えばさらに驚くべきことである。明確で説得力のある投資利益率、簡素で進化しつづけるという性質、そして周囲のサポート、これら全てが成長の重要な要因である。

より良い公共サービスのための標準

なぜ私たちはこのようなことをしたのだろうか?その答えは、そもそも「公共サービス」とは何か、ということにあると思う。全ては市民にできるだけ良い体験を提供するためである。トライメットにとってそれは、顧客が公共交通による目的地への行き方を車での行き方を得るのと同じくらい簡単に得られることだった。データをオープンにして多くの人が使えるようにしたこと、また既存のサービスとの統合を可能にしたことは、公共交通機関に新しい側面をもたらし、一地方事業者がとても想像し得ないほど多くの利用者を得ることができた。サードパーティーによる交通アプリは交通事業者やそのブランドをないがしろにするのではないかという憶測もあったが、トライメットでは多くのアプリがより幅広い利用者の獲得につながっている。アプリが顧客をより総合的な情報が載っている事業者のサイトに導き、潜在的顧客を開拓してくれているのだ。アプリがなければこうした顧客に情報が届くことはなかっただろう。

トライメットでは今もトライメット・トリップ・プランナーという独自サービスを提供している。私たちにはこれを提供する責任があると思っているからだ。そしてグーグルトランジットやBing Mapsなど、このデータを利用して開発者たちが作ったアプリは、我々の顧客に、様々なオプションや機能とともに移動を計画するまた別の方法を提供している。GTFSが潜在的な顧客の開拓を可能にし、また地域を超えた相互運用をかなえてより多くの都市への普及を可能にしているのである。

GTFSの次のステップは時刻表データに加えてリアルタイムの運行データ仕様を策定することだった。トライメット、MBTA、BART、そしてMTSはグーグルと協働して、事前に作られた時刻表だけでない、リアルタイム運行データの新しい仕様、GTFS-RTに取り組んだ(”What is GTFS-realtime?” 2012)。これは顧客にとって大変役に立つ情報で、広く採用されるようになってきている。市民発のデータ標準が、他の交通・公共サービスの区域に広がりどのような影響を見せるか、楽しみだ。

クリス・ハレルソンが言うように、

グーグルがこの物語のヒーローだと一足飛びに結論付けてしまうのは簡単だろう。イノベーターの典型的役割としてそれまでの非効率的なやり方を打ち破ったのだと。しかし実際は違う。これは、市場原理の持ち込みや行政の力だけでは取り組むことが困難な問題を、共に協力して解決するという、新しいモデルの成功の物語なのだ。それぞれが同等に重要な役割を果たしたのであり、トライメットやその他の行政機関なくしてはこの物語は語れないのだ。(Harrelson, 私信, 2013)

GTFSは、1つの公共事業者と1つの一般企業が、同じ問題の解決に一緒に創造的に取り組んだことから始まった。事業者とGTFSユーザとの密なコミュニケーションにより、より多くのアプリの要求に応えるため、標準は発展し続ける。その結果、今や世界中のほぼどこでも、公共の交通機関を使った行き方が、車での行き方を得るのと同じくらい簡単に得られるようになった。

著者について

ビビアナ・マッキューは、1997年よりTriMet(トライメット)のIT部門に勤務。現在、地理情報システムと位置情報サービスのITマネージャーとして、革新的ウェブ開発者とアナリストたちを率いている。opentripplanner.org、maps.trimet.org、rtp.trimet.org、developer.trimet.org、trimet.org/appsなど、複数のオープンデータやオープンソースソフトウェアの取り組みを行っている。グーグルとの協働でグーグルトランジットの初公開を行った後、現在世界的な標準となっているジェネラル・トランジット・フィード・スペシフィケーション(GTFS)の開発に貢献した。カンザス大学で地理学の学位を取得。

引用文献