いってきたよ
2015 6/2(火)
AWS summitへいってきました。
お弁当をたべました。
おいしかったです。
はい、行ってきました。
主にCloudSearchの為に。なので6/2しか行っていません。
CloudSearchだーいすき。HAHAHA。
今回は行ってきた感想と、情報を展開していきます。
Session内容は、CloudSearchしか話す気ないです。
その他はいつか展開するかもしれませんが…期待はしないでいただきたいです。
CloudSearchは、ランチセッションだったので、会場でお弁当ゲット。
無料のセミナーで情報もらえて、お弁当もらえて、至れり尽くせりですね。
Session内容
CloudSearch
snapdish紹介
Session1. CloudSearch Deep Dive
初回から大本命、CloudSearchです。
まず、CloudSearchとはどんなものなのかの説明から。
snapdishというレシピ検索サイトで使われているそう。
どこで使われているかというと、もちろん検索部分。
関係ないですが、
「CloudSearch、AWSの中でもそんなにメジャーなサービスじゃない。」
に、しゅーん。となりました。(笑)
CloudSearchの構築
CloudSearchはフルマネージドな検索エンジン。
個人的な感想ですが、他のAWSサービスより運用や導入は楽かな、と思います。
勿論そう思ってなんとなく使っていると痛い目見るのですが…。
そんなCloudSearchをとりあえず構築してみる。
例えで出たのは、南北線のデータ検索。(駅名だったり、他路線のデータだったり)
フィールド定義はJSON形式でuploadするだけ。楽チン。
あとは言語を選べたりできる。対応言語は34ヶ言語。
勿論日本語対応!
あとはもう検索可能に!簡単簡単!!
見出しの切り出し方
日本語は形態素解析・N-gramに対応しています。
さらに、フィールドのコピーも作れるので、同じデータでも形態素解析のフィールドとNgramのフィールドを作って、形態素解析の方を検索にヒットした際のスコアを高くするなど設定が可能。
また、辞書登録もマネジメントコンソールから・CLIからと出来るので、「きゃりーぱみゅぱみゅ」という奇怪な言葉も検索可能になります。
言葉って難しいですもんね。
CloudSearchの中身
フルマネージドというだけあって、Auto ScalingかつAuto Partitioning。
データが増えたら自動的にスケールアウト・分割してくれます。
=気が付かない内に高額請求されないようデータ管理は気をつけましょうね。(笑)
indexing
CloudSearchの中身にはELBがいて、そこから複数いるEC2の内のどこかに均等に送られる。
そのノードがデータを受け取って、S3/DynamoにUpload。
その時点でAPIとしては「200」を返します。
その後、非同期でデータをpollingしてindixingされているそうです。
なので、「200」が返ってきたからといってすぐにデータが取得できるわけではありません。
search
indexingと同様、ELBにいき、そこから複数いるEC2の内のどこかに均等に検索にいく。
しかしそれぞれのEC2に違うデータが分割されて入っているため、分散検索をしにいく。
インスタンスタイプによる違い
どんなインスタンスタイプを使えば良いかは、Sessionのスライドと扱うデータによってBestなサイズを見つけてくださいな。
CloudSearh導入例
一週間で導入したschooさん。
技術力さえあれば、一週間でも導入できる!
nanapiさん
デフォルトのまま使用しているが、そこそこいい検索になっている。
保守・運用していないが成り立っている!
ChatWork
日本の中で最大の導入例。
データ件数は5億件を超える!データが増えても検索速度は快適!!
運用はメンテナンスフリー。
その他様々な企業の方々が導入しているそうです。
感想(CloudSearchのSessionだけでなく)
単純なAWSサービスの情報だけでなく、
プレゼンの仕方等、勉強になるところが多々ありました。
有休とってまで行って良かったと思います。
AWSの方々に直接質問する機会もそうそうないので、
勇気を振り絞って質問しに行ったり…(超絶人見知り)
いやあ、自分の成長を感じますね★
全体的に残念だったのは、
会場入る時に予約したかどうかの確認が何もなかったこと。
事前予約していない人用の列はありましたが、していなくても普通に会場に先に入れてしまう運用…。
その為、事前予約した人が立ち見になり愚痴っている現場を何度か目撃しました。。
でも、何個か立ち見で見ましたが、段差のない場所で座らされるより、
立っていた方がスライドは見やすかったです。
特に私は女なので、男性ばかりの会場では身長・座高でどうしても見えなくなります。
…もちろん足は悲鳴をあげてましたが…!!!!!
あと、会場が複雑(ただの方向音痴)
CloudSearchのSessionに間に合わないんじゃないかと一人で半べそかきながら迷子ってました。
事前に会場の見取り図とか持っておくべきでしたね。
申し込み時に展開されてたでしょうか?
以上、AWS summitの情報展開でした。
Session等は、公式に公開されているので、興味のある方は是非見てみると良いと思います。
私も参加していないSessionは暇な時に見てみようかな、と思います。
特に、「Tech Deep Dive by Amazon」のみの参加なので、Amazon以外の企業のSessionにも興味がありますね。