More than 5 years have passed since last update.

Twitterでいいねを押したツイートに含まれる画像と動画をダウンロードしてGoogle Driveにアップロードする

Last updated at 2020-03-07Posted at 2020-03-07

はじめに

初心者ながら2度目の投稿です。温かい目で見守っていただければとおもいます。
GitHubにあげてます。

好きなアーティストや芸能人、スポーツ選手等のツイートに添付されている画像や動画を保存したいってことありますよね。それをプログラムでどうにかできないかなぁと思って作ってみました。

概要

TwitterのユーザIDを指定してその人がいいねしたツイートに含まれる画像・動画を一度ローカルのフォルダにダウンロードして、その後Google Driveの指定フォルダにアップロードします。cmdからpythonコマンドを叩いて動くものになっています。一定間隔で動くとか常時起動とかその辺りは対応できていません。いずれは対応したいのですが、質問にある問題が残っているので、、、

TwitterのAPIとGoogleDriveのAPIは使えるようになっているものとしてすすめます。詳しくは参考にあるサイトを参照してください。非常にわかりやすくまとめられています。

ソースコード

↓設定をまとめています。上はTwitterのAPIキーやユーザ名、下は保存するGoogleDriveのディレクトリのIDです。ご自身で取得された値を入れてください。

config.py


CONSUMER_KEY = "********************************"
CONSUMER_SECRET = "********************************"
ACCESS_TOKEN = "********************************"
ACCESS_TOKEN_SECRET = "********************************"
USER_ID = "***********"

GOOGLEDRIVE_PICS_DIRECTORY_ID = "********************************"
GOOGLEDRIVE_VIDEOS_DIRECTORY_ID = "********************************"

↓メインとして動く部分。cmdでデバッグ出力するためにエンコードしています。画像・動画が含まれるかは自動で判断しています。動画については.mp4でないもの、サイズが小さいものがあるので最もサイズが大きいものを取得するようにしています。

get_data.py

import json, config
from requests_oauthlib import OAuth1Session
import re
import download
import upload

CONSUMER_KEY = config.CONSUMER_KEY
CONSUMER_SECRET = config.CONSUMER_SECRET
ACCESS_TOKEN = config.ACCESS_TOKEN
ACCESS_TOKEN_SECRET = config.ACCESS_TOKEN_SECRET

USER_ID = config.USER_ID

twitter = OAuth1Session(CONSUMER_KEY, CONSUMER_SECRET, ACCESS_TOKEN, ACCESS_TOKEN_SECRET)

url = "https://api.twitter.com/1.1/favorites/list.json"

params ={'screen_name' : USER_ID, 'count' : 200}
res = twitter.get(url, params = params)

def main():
    if res.status_code == 200:
        for line in json.loads(res.text):
            if('extended_entities' not in line):
                return
            for i in line['extended_entities']['media']:
                if('video_info' in i): #if the tweet contains a video.
                    dic = {}
                    for v in i['video_info']['variants']:
                        if ('.mp4' in v['url']): #only .mp4 file.
                            dic[v['url']] = find_max_size(v['url'])
                    print(max(dic, key=dic.get).encode('cp932', 'ignore').decode('cp932'))
                    download.download_videos(max(dic, key=dic.get))
                else:
                    print((i['media_url_https']).encode('cp932', 'ignore').decode('cp932'))
                    download.download_pics(i['media_url_https'])
    else:
        print("Failed: %d" % res.status_code)

def find_max_size(url): #Find the max size video.
    s = re.findall(r'/\d+x\d+/', url) #e.g. /720x1280/
    t = re.findall(r'/\d+x', str(s[0])) #e.g. /720x
    u = re.findall(r'x\d+/', str(s[0])) #e.g. x1280/
    x = int(t[0].replace('x', '').replace('/', '')) #e.g. 720
    y = int(u[0].replace('x', '').replace('/', '')) #e.g. 1280
    return x * y

main()
upload.upload_pics_videos()

↓ローカルのフォルダに画像・動画をダウンロードする部分です。/pics, /videosというフォルダを作ってそこに保存しています。ファイル名は日時で一意にしています。

download.py

import requests
import datetime
import os

def download_pics(url):
  os.makedirs('pics/', exist_ok=True)
  file_name = "pics/" + datetime.datetime.now().strftime("%Y%m%d%H%M%S%f") + ".jpg"

  response = requests.get(url)
  image = response.content

  with open(file_name, "wb") as stream:
      stream.write(image)

def download_videos(url):
  os.makedirs('videos/', exist_ok=True)
  file_name = "videos/" + datetime.datetime.now().strftime("%Y%m%d%H%M%S%f") + ".mp4"

  response = requests.get(url)
  video = response.content

  with open(file_name, "wb") as stream:
      stream.write(video)

↓最後にGoogle Driveにアップロードする部分です。あらかじめドライブ上に作成しておいたフォルダにアップロードする動きになっています。

upload.py

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from pathlib import Path
import config

def upload_pics_videos():
  gauth = GoogleAuth()
  gauth.CommandLineAuth()
  drive = GoogleDrive(gauth)

  for p in Path("pics").glob("*"):
    q = str(p)
    f = drive.CreateFile({
      "parents": [{
        "id": config.GOOGLEDRIVE_PICS_DIRECTORY_ID
        }]
      })
    f.SetContentFile(q)
    f.Upload()
    print(f['title'], f['id'])

  for p in Path("videos").glob("*"):
    q = str(p)
    f = drive.CreateFile({
      "parents": [{
        "id": config.GOOGLEDRIVE_VIDEOS_DIRECTORY_ID
        }]
      })
    f.SetContentFile(q)
    f.Upload()
    print(f['title'], f['id'])

さいごに

もっときれいにソースを書くべきですね。Python初心者とはいえ、反省です。変数名とか動画の最大サイズ求めるところとか。。。ですが成果物としていつもお世話になっているQiitaさんに記事を投稿してみたい気持ちが強かった&動くものができたので勇気を出して公開してみました。

質問

TwitterのAPIにお詳しい方にお聞きしたいのですが、今回使っている GET favorites/list の制限について。実際にこのアプリケーションというかプログラムを動かしてみても、

指定件数分取得できない
1件も取得できないときがある。
時間間隔をおいて1日1回などの起動でもうまく動かない。

ネットで色々調べてみると

Rate Limit：15分で15回まで
count：200以下
一回の実行で 200x15=3,000fav が取得できる

というような制限はあるようなのですが、それは満たしているのになんでだろうっていう感じです。これはAPIの使い方が悪いからなのか、それともサーバーが重い等の問題なのか。当方初心者ですのでよくわかっておりません。コメント等で教えていただけたら幸いです。

参考

Twitter API 登録 (アカウント申請方法) から承認されるまでの手順まとめ　※2019年8月時点の情報

PythonでGoogleドライブに画像をアップロード

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up