AI を用いたタクシー配車における BigQuery 徹底活用術
"タクシー配車アプリ GO では、日々蓄積しているタクシーデータを用いて待ち時間予測などのサービスを提供しています。本セッションでは、BigQuery、BigQuery ML の機能を徹底活用することで、それらのサービスをコンパクトに実現した方法について紹介します。機能の使用例だけではなく、BigQuery をリアルタイム運用するためのノウハウ、BigQuery ML の実用上の注意点なども紹介予定です。
"
https://cloudonair.withgoogle.com/events/google-cloud-day-digital-21/watch?talk=d1-da-07
質問 | 回答 |
---|---|
ハイパーパラメータを制御しないで済むところがBQ MLのいいところと思っていましたが、やはり設定したいものがあると知ることができました。もし、MAX_ITERATIONS以外で調整できたらよいと思われるハイパーパラメーターがあったら教えてください。 | 一般的な話になります。データが過学習しやすいものかによって変わると思いますが、葉の数や木の深さなどは重要なパラメータとなります。 |
ハイパーパラメータを制御したくないということでしたら、AutoML の利用などをご検討してはいかがでしょうか | |
BigQuery GISをつかっているというお話がありましたが、以前はどういった位置情報を使っていたのですか?BQ GISのメリットはどのように感じていますか? | 一番利用している位置情報は車両の位置情報ですね。 BQ GISのメリットは、SQLで完結する点、大規模データでも素早く解析できる点が大きいです。 |
ARIMAモデルはBQで利用できますが、どのようなところが課題だったでしょうか。精度に懸念があったなどでしょうか。 | 質問ありがとうございます!BQMLのARIMAについては、精度の面の問題もありますが、リアルタイムな特徴を用いようとするとその度に再学習しなければいけないという問題がありました。 |
今回の場合は、15min毎に予測をしたく、15min毎に再学習するのはコストが高くなるため不採用となりました。 |
切り口 | 内容 |
---|---|
サービス概要 | |
処理の概要 | 駒井処理はBQではやりきれない。データサイエンティストが必要になる。モデルを使っても精度が低くなり、UXは悪くなる可能性がある。 |
料金や処理の量について | |
BQの高速化 | おもしろ高速化をやると5倍くらい早くなる |
BQMLについて | |
BQMLの課題 |