More than 3 years have passed since last update.

Kaggle Google Landmark Recognition 2020 現状まとめ

Last updated at 2020-09-04Posted at 2020-09-04

はじめに

この記事ではKaggleのGoogle Landmark Recognition 2020において人気なnotebookとdiscussionなどから現状の理解を図るものです。
これから参加したいと考える皆さんが素早くキャッチアップできることを目的としています。
どなたかのお役に立てれば幸いです。

Leaderboard

2020/09/04時点での各メダルの下限値です。
Gold : ~0.5336
Silver : ~0.4868
Blond : ~0.4853

評価関数

Global Average Precision = micro Average Precisionというものが使われています。

https://www.kaggle.com/c/landmark-recognition-2020/overview/evaluation

この定義から言えることは、confidenceの高い回答ほどスコアへの影響が大きいということです。
例えば100の回答中1つだけ正解するとして、この正解の位置が最初の場合は、最後が正解の場合に比べて、スコアが100倍になります。
回答の位置はconfidenceを降順に並べて決まりますので、confidenceの高い回答ほど影響力が大きいと言えます。

以下の説明がわかりやすいです。

EDA

EDAでは主に以下のことがわかっています。

8万以上のクラス (1)
各クラスに属する画像の数は2~6272枚 (1)
42枚以下のクラスが大部分 (1)
6272枚のクラスは画像が黒く縁取りされており画像したにラベルがある。その中身は統一感がない (1)
- クラス未分類、あるいはランドマークなし用のクラスかもしれない (1)
inputする画像のサイズはまちまちなのでサイズの変換が必要 (2)
画像が複雑すぎるのでstructural similarity は役に立たない (3)
RGB color intensity histogram は役に立ちそう (3)
ランドマークでない画像もあるので、それらは外す必要 (4)

モデル

紹介されている主なモデルは以下です。

ResNet50 (1)、(2)、(4)、(8)、(11)
EfficientNet (3)、(6)、(7)、(10)
MobileNetV2 (5)
Xception (9)
DELG (Global featureとLocal featureから類似度を計算) (15)
- Kaggleホストのベースライン手法です。以下でまとめました。
- まとめ：Kaggleで注目を集める画像特徴量抽出新手法、DELGの概要紹介

その他（技術、注目トピック）

その他、雑多に以下の技術や注目トピックが話題になっています。

multi processing でデータの読み込み速度を高速化 (1)
データの逐次読み込み
- flowfromdirectory
TF recorder (17)、(18)
data augumentation (2)
GAPの定義　(3)、(5)、(8)、(16)、(19)、(20)
ArcFace (4)
place 365 model (5)、(7)
TPU for parameter search (6)
ImageHashing (9)
Google Colab (10)
ORB (11)
ArcMargin (12)
リサイズ (13)
global feature, local feature (14)
- DELG feature extraction (15)
re rank (15)
過去コンペのまとめ (21)、(22)、(26)
関連研究 (23)
元のデータセット(24)、(25)

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up