LoginSignup
6
8

More than 3 years have passed since last update.

Python+Seleniumで楽天カードの明細をCSVダウンロードする

Last updated at Posted at 2021-04-15

PythonとSeleniumを使って、楽天カード(楽天e-NAVI)サイトにログインして明細データを取得(CSVダウンロード)する方法を試してみました。

サンプルコード全文も記事の後半に載せているので参考になれば幸いです。そしてもっと上手いやり方ご存知の方いらっしゃったらぜひ教えてください^^

※2021/04/15時点の情報です。

環境

  • Windows 10
  • Python 3.8
  • Selenium 3.141.0

はじめに

ログインまでの部分や、webdriverのプロファイル設定に関する部分については、以下記事をご確認ください。

↑ログインするところまでのサンプルです。(本記事のサンプルコードにもログイン部分あります)

↑サンプルのwebdriverは、Firefoxを使っています。CSVダウンロードするにあたって、Firefoxのプロファイル設定が必要なので、そのあたりを解説しています。

対象画面まで遷移させる

まず、楽天カード(楽天e-NAVI)のログイン後TOP画面から明細ダウンロード画面までどういう経路で遷移できるかを確認してみます。

<画面フロー>

  1. TOP画面
  2. お支払い(ご利用明細)画面 ← ここでCSVダウンロード

上記フローで目的の画面まで遷移できることが分かりました。では続いて、具体的に各画面ごとの遷移処理を見ていきましょう。

◆ログイン後のTOP画面

20210414-003.png

TOP画面からご利用明細画面への遷移は、画面上部にある「お支払い(ご利用明細)」メニューの中にあるリンクをクリックします。

あるいは、画面下部の「サービス一覧」エリアにも、ご利用明細画面へのリンクがあります。

20210414-002.png

URLを調べてみるとどちらも同じで、静的HTMLへのリンクになっていたので、今回はget()メソッドを使って遷移させてみました。

# お支払い(ご利用明細)画面まで遷移
browser.get("https://www.rakuten-card.co.jp/e-navi/members/statement/index.xhtml")

# browser.find_element_by_xpath("//dt[contains(.,'ご利用明細')]").click()
# 上記でも遷移可能だが、URL指定で遷移できる場合は、そっちのほうが確実

◆お支払い(ご利用明細)画面

get()メソッドを実行すると、お支払い(ご利用明細)画面に遷移します。

20210414-004.png

期間を指定する

続いて、CSVダウンロードしたい対象の期間を指定します。期間を指定するには、「ほかの月の明細を見る」ボタンをクリックします。

20210414-005.png

クリックすると、下記のような月を選択する小窓が開きます。

20210414-006.png

この小窓で対象月をクリックすると、明細が表示されます。

20210414-007.png

ここまでの操作のコードは以下のようになります。

# ダウンロード対象期間指定
# ほかの月を見る
# 一度期間指定したあとに、別の月を見たい時はこのボタンクリックから再開
browser.find_element_by_id("js-payment-calendar-btn").click()

# 対象月指定
# リンクテキストは操作年の月と同じ
browser.find_element_by_link_text("3").click()

ちなみに、小窓を表示させたあとに年を切り替えたい時は次のようなコードになります。

# 前年のカレンダー表示させる場合
browser.find_element_by_id("js-payment-calendar-prev").click()
# 翌年のカレンダー表示させる場合
browser.find_element_by_id("js-payment-calendar-next").click()

CSVダウンロードを実行

明細行が表示されたら、「明細コピー用 Excel(CSV)」ボタンをクリックすると、CSVファイルをダウンロードすることができます。

20210414-008.png

オーバーレイ広告に注意!

ただ、ここで1点ハマったところがありました。

それは、Seleniumでヘッドレスモードではなく、ブラウザ起動した状態では上手くダウンロードできるのに、ヘッドレスモードにした場合だけ、なぜか次のようなエラーが発生していました。

ElementClickInterceptedException: Message: 
Element <a class="~中略~"> is not clickable at point (954,707) 
because another element <img src="~中略~"> obscures it

色々調べてみた結果、ヘッドレスモードとブラウザ起動した時とではブラウザのウィンドウサイズが異なっていて、そのせいで挙動が異なる場合があるようです。

参考:
https://yuki.world/selenium-headless-chrome-not-interactable/

今回の楽天カードの例でいうと、、、

20210414-009.png

どうやらヘッドレスモードで実行した時のウィンドウサイズが小さく、上記のような画面最下部に表示される広告が上に被さってしまった結果、ダウンロードボタンを指摘できずにエラーとなってしまったようです。

もう一度エラー内容を見てみましょう。

ElementClickInterceptedException: Message: 
Element <a class="~中略~"> is not clickable at point (954,707) 
because another element <img src="~中略~"> obscures it

対象のaタグエレメントがクリックできないよ、なぜならimgタグが覆い隠しているから。という意味ですね。

このような事象を回避するには2つ方法があります。

  1. ヘッドレスモードのウィンドウサイズを拡張する
  2. 画面スクロールさせる

今回は2の画面スクロールさせる方法で回避しました。そのコードがこちらです。

# ウィンドウスクロール
# ヘッドレスモードだと、CSVダウンロードボタンがオーバーレイ広告と重なってしまい
# エラーが発生するため、ウィンドスクロールさせて表示位置をずらす
browser.execute_script("window.scrollTo(0, 300);")

# CSVダウンロード実行
browser.find_element_by_link_text("CSV").click()

これで無事、CSVダウンロードできると思います。

以上、Python+Seleniumで楽天カードの明細をCSVダウンロードする方法でした!

サンプルコード全文

#
# 楽天カードサイトへログイン
#

import time
import json
from selenium import webdriver
from selenium.webdriver import Firefox, FirefoxOptions
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as ec

# 設定ファイルを取得
login_info = json.load(open("login_info.json", "r", encoding="utf-8"))

# ログインサイト名
site_name = "card_rakuten"

# ログイン画面URL
url_login = login_info[site_name]["url"]

# ユーザー名とパスワードの指定
USER = login_info[site_name]["id"]
PASS = login_info[site_name]["pass"]
PASS2 = login_info[site_name]["pass2"]

# ダウンロードフォルダ
# 相対パス指定はできない模様
# dl_folder = r"..\dl-data"
# TODO: ダウンロードフォルダのパスは適宜変更してください
dl_folder = r"ダウンロードフォルダのパスを指定"

# オプション設定
options = FirefoxOptions()

# ヘッドレスモードを有効にする
options.add_argument('--headless')

# プロファイル設定
fp = webdriver.FirefoxProfile()

# ダウンロードフォルダ指定
# 0: デスクトップ、1:システム規定のフォルダ、2:任意の指定フォルダ
fp.set_preference("browser.download.folderList", 2)
fp.set_preference("browser.download.dir", dl_folder)

# ダウンロードマネージャウィンドウを表示させない
fp.set_preference("browser.download.manager.showWhenStarting", False)

# MIMEタイプを設定
fp.set_preference("browser.helperApps.neverAsk.saveToDisk", "application/octet-stream;text/csv")

# Firefoxを起動する
browser = Firefox(options=options, firefox_profile=fp)

# ログイン画面取得
browser.get(url_login)

# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.ID, "loginButton"))
)
print("ログイン画面遷移成功")

# 入力
e = browser.find_element_by_id("u")
e.clear()
e.send_keys(USER)
e = browser.find_element_by_id("p")
e.clear()
e.send_keys(PASS)

# ログイン
button = browser.find_element_by_id("loginButton")
button.click()

# 第2パスワード入力画面
# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.ID, "indexForm:password"))
)
print("第2パスワード入力画面遷移成功")

# 第2パスワード入力
e = browser.find_element_by_id("indexForm:password")
e.clear()
e.send_keys(PASS2)

# ログイン
button = browser.find_element_by_name("indexForm:j_idt78")
button.click()

# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.CLASS_NAME, "rf-font-bold"))
)
print("TOP画面遷移成功")

# ログインできたか確認(画面キャプチャ取る)
# browser.save_screenshot("../screenshots/card_rakuten/home.png")

# お支払い(ご利用明細)画面まで遷移
# browser.find_element_by_xpath("//dt[contains(.,'ご利用明細')]").click()
# URL指定で遷移できる場合は、そっちのほうが確実
browser.get("https://www.rakuten-card.co.jp/e-navi/members/statement/index.xhtml")

# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.ID, "js-payment-calendar-btn"))
)
print("お支払い(ご利用明細)画面遷移成功")

# ダウンロード対象期間指定
# ほかの月を見る
# 一度期間指定したあとに、別の月を見たい時はこのボタンクリックから再開
browser.find_element_by_id("js-payment-calendar-btn").click()

# 前年のカレンダー表示させる場合
# browser.find_element_by_id("js-payment-calendar-prev").click()
# 翌年のカレンダー表示させる場合
# browser.find_element_by_id("js-payment-calendar-next").click()

# 念の為スリープ
time.sleep(1)

# 対象月指定
# リンクテキストは操作年の月と同じ
browser.find_element_by_link_text("3").click()

# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.CLASS_NAME, "payment-amount-other-ttl"))
)
print("明細表示成功")

# ウィンドウスクロール
# ヘッドレスモードだと、CSVダウンロードボタンがオーバーレイ広告と重なってしまい
# エラーが発生するため、ウィンドスクロールさせて表示位置をずらす
browser.execute_script("window.scrollTo(0, 300);")

# CSVダウンロード実行
browser.find_element_by_link_text("CSV").click()

# ログアウト画面へ遷移
browser.find_element_by_link_text("ログアウト").click()

# ページロード完了まで待機
WebDriverWait(browser, 10).until(
    ec.presence_of_element_located((By.XPATH, "//img[@alt='ログアウト']"))
)
print("ログアウト画面遷移成功")

# ログアウト
browser.find_element_by_xpath("//img[@alt='ログアウト']").click()

# 処理終了
browser.quit()
6
8
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
8