はじめに
この記事ではKaggleのGoogle Landmark Recognition 2020において人気なnotebookとdiscussionなどから現状の理解を図るものです。
これから参加したいと考える皆さんが素早くキャッチアップできることを目的としています。
どなたかのお役に立てれば幸いです。
Leaderboard
2020/09/04時点での各メダルの下限値です。
Gold : ~0.5336
Silver : ~0.4868
Blond : ~0.4853
評価関数
Global Average Precision = micro Average Precisionというものが使われています。
この定義から言えることは、confidenceの高い回答ほどスコアへの影響が大きいということです。
例えば100の回答中1つだけ正解するとして、この正解の位置が最初の場合は、最後が正解の場合に比べて、スコアが100倍になります。
回答の位置はconfidenceを降順に並べて決まりますので、confidenceの高い回答ほど影響力が大きいと言えます。
以下の説明がわかりやすいです。
EDA
EDAでは主に以下のことがわかっています。
- 8万以上のクラス (1)
- 各クラスに属する画像の数は2~6272枚 (1)
- 42枚以下のクラスが大部分 (1)
- 6272枚のクラスは画像が黒く縁取りされており画像したにラベルがある。その中身は統一感がない (1)
- クラス未分類、あるいはランドマークなし用のクラスかもしれない (1)
- inputする画像のサイズはまちまちなのでサイズの変換が必要 (2)
- 画像が複雑すぎるのでstructural similarity は役に立たない (3)
- RGB color intensity histogram は役に立ちそう (3)
- ランドマークでない画像もあるので、それらは外す必要 (4)
- Google Landmark Recognition 2020 | EDA
- GLR for beginners: fetch the data, basic EDA
- LandmarkReco-2020-Class Imbalance Deep Dive -EDA
- Watch out for distractors in test dataset!
- GLRec - Images in the form of long strips
モデル
紹介されている主なモデルは以下です。
- ResNet50 (1)、(2)、(4)、(8)、(11)
- EfficientNet (3)、(6)、(7)、(10)
- MobileNetV2 (5)
- Xception (9)
- DELG (Global featureとLocal featureから類似度を計算) (15)
- Kaggleホストのベースライン手法です。以下でまとめました。
- まとめ:Kaggleで注目を集める画像特徴量抽出新手法、DELGの概要紹介
- LandmarkReco-2020-Class Imbalance Deep Dive -EDA
- ResNet50 TL
- [PyTorch Training+Inference] EfficientNet Baseline
- [GLRec] ResNet50 ArcFace (TF2.2)
- Pre-trained MobileNetV2 (1000 classes, 1 epoch)
- TF Keras EffNet B2 - Non Landmark Removal
- Landmark Recognition 2020 Keras
- Landmark Recognition 2020[EDA+ Resnet]
- Landmark Recognition Starter Code - Xception
- Pre-trained EfficientNet
- ResNet50-v10-v12
- Host Baseline Example
その他(技術、注目トピック)
その他、雑多に以下の技術や注目トピックが話題になっています。
- multi processing でデータの読み込み速度を高速化 (1)
- データの逐次読み込み
- flowfromdirectory
- TF recorder (17)、(18)
- data augumentation (2)
- GAPの定義 (3)、(5)、(8)、(16)、(19)、(20)
- ArcFace (4)
- place 365 model (5)、(7)
- TPU for parameter search (6)
- ImageHashing (9)
- Google Colab (10)
- ORB (11)
- ArcMargin (12)
- リサイズ (13)
- global feature, local feature (14)
- DELG feature extraction (15)
- re rank (15)
- 過去コンペのまとめ (21)、(22)、(26)
- 関連研究 (23)
- 元のデータセット(24)、(25)
- Landmark-Recognition-Multiprocessing | Image-Size
- EDA + Data Augmentation for Beginners
- [PyTorch Training+Inference] EfficientNet Baseline
- [GLRec] ResNet50 ArcFace (TF2.2)
- TF Keras EffNet B2 - Non Landmark Removal
- Starter - Keras Tuner, EfficientNet, TPU
- PyTorch Landmark or Non-Landmark identification
- Global Average Precision [Metric]
- ImageHashing -> Small, yet diverse training set
- Download dataset to Google Colab
- Google Landmark Recognition - EDA
- ResNet50-v10-v12
- Resizing the image to 20%
- Google Landmarks Feature Extraction
- Host Baseline Example
- compute_recognition_metrics.py
- TF records
- Training tf records available here for download !!!!!
- Global Average Precision
- Evaluations
- Last year's top solutions
- Landmark2019-1st-and-3rd-Place-Solution
- Relevant research papers
- Google Landmarks Dataset v2
- Announcing Google-Landmarks-v2: An Improved Dataset for Landmark Recognition & Retrieval
- 1st place solution summary
- Unifying Deep Local and Global Features for Image Search