Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
1999
Help us understand the problem. What is going on with this article?
@ulwlu

「機械学習はデータ集めるのが一番大変・・・」⇛Googleが大量の機械学習用データベースを無料公開してた

機械学習は素材集めがとても大変です。
でもこの素材集め、実は無理してやらなくても、元から良質な無料データベースがあったようなのです。

URLはこちら

YouTube8-M
https://research.google.com/youtube8m/explore.html

提供されているサービスは以下の通り

  • 800万個の動画
  • 19億個のフレーム
  • 4800個の分類 image07.png

使い方はExploreから画像セットを探し、ダウンロードするだけ。

他の方法も見つけた

open images dataset

「すごい神だな」と思ったのは

スクリーンショット 2019-04-10 15.58.35.png

これもう完成されてますよね
もちろんこの認識前の画像もセットでダウンロードできます。
Youtube-8Mとは、画像数を取るか、精度で取るか、という違いでしょうか。

もう一つ良い素材集がありました・・・

(はてなブックマーク情報 @sek_165 さん )
githubに、用途集でまとめられているレポジトリがありました。
今まで、上記のウィキペディアのリストから直接探していたのですが、これは全てクイックリンクになっているので便利ですね!

https://github.com/arXivTimes/arXivTimes/blob/master/datasets/README.md
スクリーンショット 2019-04-11 19.38.56.png

Qiitaにも素晴らしい記事がございました

@Hailee さんの記事です。
データ分析に必要なデータソース20選(無料で使える)

世界中の行政からGoogleデータベースまで、かなり網羅されています。
今回ご紹介したYoutubeデータセットについても先んじてご紹介されていらっしゃいました。

まとめ

これまでも東大松尾研究室や、AWSや、キカガク社などから機械学習に関する無料情報(全詳細)が公開されてきましたが、これはyoutubeというプラットフォーム上豊富なカテゴリーに対応しててすごいなーと思いました。

1999
Help us understand the problem. What is going on with this article?
Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
ulwlu

Comments

No comments
Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account Login
1999
Help us understand the problem. What is going on with this article?