はじめまして。
さて、今回は修士論文研究の都合上、Twitterデータを使用することになったため、Academic Research product trackに加入する機会がありました。
ついでなので、Academic Research product trackに加わることで得られる嬉しいメリットと、申請手順について書いていきたいと思います。
#目次
1. Twitter Academic Research product trackとは?
2. Twitter Academic Research product trackの申請
#1. Twitter Academic Research product trackとは?
2021年2月に公開された研究者向けのTwiiter APIの仕様です。
Twitterは今までプライバシーの観点からAPIの利用にかなり強い制限をかけてきていたのですが、研究用途であることを条件に制限を解除してくれています。しかも**無料!!**最も待遇のいい仕様なのではないでしょうか。(2021年6月10日現在)
https://developer.twitter.com/en/products/twitter-api/academic-research
利用可能な人
研究者向けということもあり、利用可能な人は大学院生以上に限られています。
どうしても使いたいという学部生の方は、指導教官に相談してみるといいかもしれません。
- 論文を執筆中の大学院生(修士課程・博士課程)
- 学術機関に所属している/雇用されている研究員
利用のメリット
Academic Research product trackによる一番のメリットは、Twitterサービス開始時の2006年にまで遡ってTwitter上のデータを取得できることでしょう。(従来はTwitter社にお布施する必要がありました。)
そのほかにも以下のようなメリットがあります。
- 月に収集できるツイートの上限が1000万件に強化(標準APIだと50万)
- Full Archive Search(全てのツイートから検索)
- Recent search(直近7日間のツイートから検索)
- Sample Stream(直近ツイートのXパーセントを取得)
- Tweet/User lookup(特定ツイート・ユーザーのデータの取得)
- Follows lookup(フォロー・フォロワー関係の取得)
正直、従来のAPIでもほとんどの機能は使えていましたが、収集できるツイートデータの時間的制約がなくなったことと、取得できる上限が爆増したことが、分析上ありがたいですね。
特に最近は、ネットワーク分析が盛んなのでTwitterを使いたい方も多いのではないでしょうか。
そこで、この便利なAPIを私が実際に取得したときの流れについて書いていきたいと思います。
#2. Twitter Academic Research product trackの申請
申請は、Twitter社がデベロッパー向けに提供しているDeveloper Platformから行います。
※申請には、Twitterアカウントが必要です。
申請ページへ移動
リンクを開き、下にスクロールしていくと図のように「Apply」とあるので、ここから申請手続きを進めていきます。
すると以下のような画面に遷移するので、Start Academic Research applicationを選択します。
ブラウザでTwitterのログイン情報を保存していない人は、このあたりでログインを求められるので、ログインしておいてください。
研究者情報の入力
いざ本番。まずは、研究者のプロフィールを入力していきます。なお入力は英語です。
入力を求められる情報は以下の通りです。
-
研究者のフルネーム
-
研究者のプロフィールページ・所属機関のウェブサイト等
-
- ~~筆者は所属している大学院の研究科ページを入力して通りました。~~
- その後メールが来て、やはり名前の載っているウェブサイトを教えてくれとのことでした。筆者は特にそういったウェブサイトがなかったので、指導教官のページを載せ、コンタクトをとってもらいました。
-
-
所属機関
-
所属機関の住所
-
研究分野
- 筆者はPolitical Scienceでした。
このあたりまでは、楽勝ですね。
次のステップあたりから英語が嫌いな人はメンタルがやられるかもしれません。でもその先には超便利なアカデミックAPIの使用権があるので頑張って。。。(今はDeepLなどもありますし)
研究プロジェクト情報の入力
研究プロジェクト名
好きにつけていいですが、審査員がわかりやすい名前にしましょう。
所属機関外から援助を受けているか
筆者は修論執筆目的なので、No。
リサーチプロジェクトの概要 (最低200文字)
ここにリサーチプロジェクトにおいて何をするのかを明記します。
字数制限を満たすことができれば申請できますが、情報が足りていないと審査チームからメールで根掘り葉掘り聞かれるので、あらかじめ詳細に書いておくことをお勧めします。
どのようにTwitterデータやTwitter APIが使用されるか
ここでは、使われるデータの種類(ツイートなのかBioなのかフォロワーなのか等々)やその用途を明記していきます。その際に、使用するAPIまで記載しておくと審査側もどのような作業を実際に行うのか想定しやすくなります。
とはいえ、コードそのものを書く必要はなく、APIのサマリーからどの機能を使うかを選んで書くぐらいのイメージで大丈夫です。
Twitterデータは個別/アグリゲーションのいずれの形で提示されるか
プライバシーにかかわる話です。もし、研究結果を個人レベルで提示したい場合にはindividualを、個人レベルではなく、統計としてまとめた形で提示したい場合にはAggregateを選択してください。
おそらくindividualの方が審査は厳しくなると思われます。
Twitterデータ(ツイート・ユーザー)を分析する方法
分析する方法がどの粒度で問われているかはよくわかりませんでした。
筆者は、使用する統計パッケージと言語(R)を明記した上、個人を特定できない形でコミュニティ検出を行う旨を書き、無事にPassしました。
研究の公開方法(ツール、データ、リソース)
その名の通り、研究の公開方法を書きます。筆者の場合は修論だったのでその旨を書いたうえ、(字数が余ったので)Twitterのデータであることはちゃんとサイテーションで載せるからね!と宣言だけしておきました。
ジャーナル等に掲載予定のある方は、その旨を記載しておけば間違いないでしょう。
Twitter分析の結果やデータが政府機関にも公開されるか
これはNoでした。政府との関係によっては審査が厳しいのでしょうね~。政府系の皆様、ファイトです。
##レビューと規約の確認
おつかれさまでした!!!
これにて入力はすべて完了です。もう一度間違いがないか確認し、利用規約に同意して、Submit Applicationしてください。
申請から審査が完了するまでには最大数週間かかるようですが、私の場合は申請した次の日にプロフィールの確認をされた後、無事にPassしました。研究内容によって審査の難易度に差はあるかと思いますが、根性で最後まで頑張りましょう。正式な審査完了メールが来たら、APIが使えるようになっています。
ここまで読んでいただき、ありがとうございました。
皆様のデータ分析Lifeの一助となれれば幸いです。
今後もTwitter APIの使い方など備忘録も兼ねてまとめていきたいと思います。
それでは、また。