#初めに
私が勤めさせてもらっている会社の出退勤は会社のサーバーにログインして
出退勤のページまでポチポチが必要です。。。うーん、面倒だ。
Python で楽できないかなー
#まずは、chrome 立ち上げてみるか
色々ググって斜め読み。
とりあえず、これが楽ちんそうだ。
#事前に以下を実行しライブラリをインストールしてね
#pip install webdriver_manager
#pip install selenium
#↓ python から ブラウザドライバに命令を出せるようになる
from selenium import webdriver
#↓ ブラウザドライバを勝手に取りに行ってくれる
from webdriver_manager.chrome import ChromeDriverManager
#貴方のChromeバージョンに適したドライバを勝手に取得しつつ、
#Chrome を制御することをココに宣言します!('-'*ゞ
driver = webdriver.Chrome(ChromeDriverManager().install())
#Chrome を開く
driver.get("https://www.google.co.jp")
解説はココが神。
#なんかググってみる
次は検索でもしてみるか。とりあえず以下をコピペで試してチョ
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManager
#↓ 記述がシンプルになるオマジナイ
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome(ChromeDriverManager().install())
driver.get("https://www.google.co.jp")
search_box=driver.find_element_by_name("q")#検索ボックスをブラウザから探して search_box と宣言
serach_box.send_keys("amazon") #検索ボックスにamazonって入れてみる
serach_box.send_keys("keys.RETURN") #検索ボタンをクリックして GO!!
解説はココが神。
#社員専用ページに python でログインできた
たぶん、前述の知識を組み合わせると "Chrome を立ち上げ => 社員専用ページにログイン"まで行けると思う。
私の場合は、出退勤の画面を開くと新しいタブが開く。
Python で制御できるのは 1page だけ。
新しいタブで開いたページを継続して制御してほしい場合は、
今のページから新しいタブのページにスイッチが必要。
handle_array = driver.window_handles #今開いているウィンドウを handle_array に突っ込み、配列化
driver.switch_to.window(driver.window_handles[1]) #新規で開いたウィンドウを開く
ココが分かり易い。
#つまいずいた rev1
社内システムでは、月単位で累計残業時間が 20時間を超えるとアラートが出てくる場合がある
ココを見てもらうとアラーとのイメージできるかも
つまり、アラートを消さないと出勤画面に進めない。
#方針
#alert が表示される前提で、accept() でポップアップを消す
#alert が表示されない場合は、pass というなのスルーで次の処理に進む
try:
alert = driver.switch_to.aleart()
alert.accept()
except:
pass
前述の記述についてはココが神
念のため、アラートを消した後、
今モニタしている画面が何処なのかを
以下のコマンドで確認しながら進むと余計な混乱を防げる
print(driver.current_url)
#つまいずいた rev2
やっとのことで辿り着いた出退勤画面。
Xpath を指定しても Error がでる。
そんな Xpath ありませんよ。。。ってね。
答えはコレでした。
平たく言うと HTML のpage は分割されている事があり、
何処の Frame をアクセスするか指定しないといけない場合がある。
へー、勉強になりました。
#あとはポチポチ出勤ボタン、退勤ボタンを押すだけ
一応、時間を見て、"出勤、退勤、何もしない"
から勝手に選択してもらうようにした。
以下を見て、適当に時間を抽出して if 分を書けば大丈夫。
一応イメージをメモしておく。
#事前に import datetime を宣言
#dt_now = datetime.datetime.now() も宣言
#dt_now は今日の日付情報が詰まった箱をイメージしてね
if dt_now.hour == 8 and 0 <= dt_now.minute <= 45:#8:00 ~ 8:45 の間にアプリを起動すると出勤処理
#出勤ボタンをクリック
elif dt_now.hour == 17 and 15 <= dt_now.minute or 18<=dt_now.hour:#17:15 以降の場合は退勤処理
#退勤ボタンのクリック
else #それ以外の時間帯は立ち上がった chrome を閉じる
driver.quit()
exit()
#上司に出退勤を知らせるメールも飛ぶようにしておく
まずは以下を軽く読んでみる
出退勤の処理後に、適当に書き換えた以下のプログラムを走らせた。
#事前に import datetime を宣言
#dt_now = datetime.datetime.now() も宣言
#dt_now は今日の日付情報が詰まった箱をイメージしてね
import win32com.client
outlook = win32com.client.Dispatch("Outlook.Application")
mail = outlook.CreateItem(0)
mail.to = 'jyoshi@com'#上司のメアドを入れる
#↓表題は今日の日付を勝手に取り込む記述に調整
#dt_now.month は月の情報,dt_now.dayは日の情報
#.format() を使ってテキスト内に変数(日付)をぶち込む
mail.subject = '{}/{} 在宅勤務を開始します'.format(dt_now.month,dt_now.day)
mail.bodyFormat = 1
mail.body = '''
'''
mail.Send()#メール送信
driver.quit()#出退勤画面を表示していた chrome を閉じる
やりたいことが出来た。うれぴー
一応、アプリの起動中は、ほかの作業してても処理は進むので
事実上、時間短縮が出来たといえる。
-めでたし、めでたし-
#その他
・UA 偽装とかやってみたけど、chrome のままアクセスが速かった。
・その他、オプションを試すと 2,3秒早くなった。
・今回は chromdriver を使った。IEdriver は正直癖が多く、動かないこともあり使い勝手が悪かった。
PC のセキュリティやレジストをいじらないとダメ。もっと手軽にやりたい。
・その他のブラウザは試していない
・最近、アルゴ本読んでるけど、今回あまり使わなかった。
アルゴと結び付けながらコード書くってどんな作業になるんだ??
・自分のためではなく、みんなの為にコードを書く。
・"各々の環境が異なる中で一律に動くソフト作り"は難しいことだと感じた。
・でも逃げずに向き合えば新しい学びがあり、成長につながって嬉しかったし楽しかった。
・シェアした仲間には喜んで貰えた。
・やはりコミュニケーションは大切だ。
・関係ないけど、英語の勉強でトレーラーに字幕をつけてみた。
outlast の最新トレーラーです。よかったらドウゾ(youtube上で日本語 字幕表示の設定をしてください)。
#追加リクエスト1
処理を軽くしてスピードをあげたいとリクエストがあった。
ただ、自分が試している感触からすると、アクセスが集中する"出勤"の時間帯はどうしても遅くなる。
例えば 8:45までに出退勤する場合、8:40 ~ 45 は鬼のように遅い。
なので遅くとも 8:30 までにアプリを起動するように伝えたところ、
改善が見られた。
退勤はそもそも、各々の時間で切っているため、アクセスが集中せず
快適に動くようだ。
念のため試した option とかを貼っておく。
options = webdriver.ChromeOptions()
#https://www.ugtop.com/spill.shtml で偽造したいブラウザの情報を確認
UA = 'Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko'
options.add_argument('--user-agent=' + UA) #Chrome を IE として開く
options.add_argument('--disable-extensions') #全ての拡張機能を無効化
options.add_argument('--proxy-server="direct://"') #Proxy経由ではなく直接接続する
options.add_argument('--proxy-bypass-list=*') #すべてのホスト名
options.add_experimental_option("excludeSwitches", ["enable-automation"])#自動制御されてるウィンドウを消す
options.add_experimental_option('useAutomationExtension', False)#自動制御されてるウィンドウを消す
options.page_load_strategy = 'eager' #page open のスタイルを normal => eager に変更
options.add_argument('--blink-settings=imagesEnabled=false')#画像を無視
#最新ドライバーの取得後にブラウザ制御を開始
driver = webdriver.Chrome(options=options,executable_path=ChromeDriverManager(path="C:/Users/1919/Pictures").install())
Chrome Driver Manager はドライバーの update を見つけると、
格納パスを指定することで勝手に、そこに保存してくれる。
残念だが headless は社内のコンプライアンスとして認められなかったので未検証。
以下の記述にも淡い期待を持ったが、ダメだった。
##結論
アクセスの時間帯をずらして、アプリを動かす事が何よりも対策となった(自分は)
Simple is best!!
#追加リクエスト2
退勤メールの本文に、その日のスケジュールを埋め込んで欲しいらしい。
とりあえず、outlook からスケジュールを引っ張る情報を探した。
とりあえずコピペで動作確認しつつ、私好みに書き換えた。
import win32com.client
import datetime
from dateutil.relativedelta import relativedelta
outlook = win32com.client.Dispatch("Outlook.Application").GetNamespace("MAPI")
today = datetime.date.today()
TwoDaysAgo = today + relativedelta(days=-2)
def get_schedule(num):
calender = outlook.GetDefaultFolder(9) # "9" はスケジュール
items = calender.Items # スケジュールの中身を全部 items に突っ込む
dic = {}
#本家は ↓ が for event in items となっている。
#この場合、items[0] から順に event に代入する。
#実は items[0] はスケジュール最古の情報。最新が欲しい場合は items[-1] から順に回す必要あり
#よって、reverse を使った。今日のスケジュールだけを取り出したかったので、これにより処理時間が格段に減った。
#
#実は items 内は時系列に情報を格納していない。大枠は時系列だが 1,2 日ごちゃまぜになっているケースがある
#辞書で {key : 日付、データ : スケジュール情報} として管理。後程 key(時間) でソートする。
#ソート後(時系列)に配列を組み直す。
#それによりコメント最下部にある最終イメージで項目を時系列に箇条書きが出来る。
for event in reversed(items):
if event.start.date()==today: #日付が今日!!
key = event.start.time().strftime("%H:%M:%S") #日付型のデータは key となりえないので文字変換
dic[key] = "・"+event.subject #格納データの文頭に "・" をくっつけたい
elif event.start.date() <= TwoDaysAgo: #2日以前のデータが来たら break
break #余分に確認して"今日"の収集漏れを防ぐ
dic = sorted(dic.items()) #冒頭に述べたように前述の辞書を時間でソートする
num.append("■Schedule") #箇条書きの top に "■Schedule" と名付けたい
for a,b in dic: #辞書のデータだけを取り出してソート済みのデータを
num.append(b) #順番に num に格納していく。
##イメージ
#["■Schedule","・会社用 PC に電源を入れる","・個人用 PC に電源を入れる","・メールをチェックする","・youtube をチェックする"
# ↓
#今後の記述でメール本文には以下のように表示させる(予定)
# ↓
#■Schedule
#・会社用 PC に電源を入れる
#・個人用 PC に電源を入れる
#・メールをチェックする
#・youtube をチェックする
#・...etc
#追加リクエスト3
退勤メールの本文に、その日の Zendesk の update を埋め込んで欲しいらしい。
一応 Zendesk の説明は以下が神。
まぁ、技術サポートの問い合わせを取りまとめるシステムです。
顧客からのメールの受信と顧客へのメールの送信を一括管理することで、
技術サポート業務を個人のスペックに依存せずにシステムで一律管理する感じです。
んで、こちらから送信、or 顧客からメールを受信した場合に
outlook にメールが飛んできます。
これを退勤メールに貼ることで、今日一日のアクティビティが一目瞭然になる。
っというわけで、outlook の受信ボックスを読み込む知識が必要。
##しかし、つまずいた
メールアドレスが正しく読めない。
こんな感じになる。
/O=Microsoft/OU=EXCHANGE ADMINISTRATIVE GROUP (XXXXXXXX)/CN=RECIPIENTS/CN=UserA
ググったら、神が居た。
ほぼ水平に近い斜め読み。
よし、動かしてみよう。。以下に一旦落ち着いた。
import win32com.client
import datetime
from dateutil.relativedelta import relativedelta
outlook = win32com.client.Dispatch("Outlook.Application").GetNamespace("MAPI")
today = datetime.date.today()#やはり受信データも時系列でデータを配列としてデフォルトで格納されていない
TwoDaysAgo = today + relativedelta(days=-2)#前述にあるように今日の日付けと 2 日前の日付けを用意する
def get_zendesk_update(num):
inbox= outlook.GetDefaultFolder(6)
messages = inbox.Items
dic = {}
for message in reversed(messages):
if message.receivedtime.date() <= TwoDaysAgo:
break
elif message.receivedtime.date() == today:
if message.Class== 43:
try:
if message.SenderEmailType== "SMTP" \
and message.SenderEmailAddress == "waiwai_support@zendesk.com":
print("========")
print("Subj: " + message.Subject)
print("Email Type: ", message.SenderEmailType)
print("Name: ", message.SenderName)
print("Email Address: ", message.SenderEmailAddress)
print("Date: ", message.ReceivedTime)
key = message.ReceivedTime.time().strftime("%H:%M:%S")
dic[key] = "・"+message.Subject
except Exception as e:
print(e)
continue
dic = sorted(dic.items())
num.append("■Zendesk_update")
for a,b in dic:
num.append(b)
基本は追加リクエスト 2 に書いた補足をイメージ出来れば補足説明無くても読めると思います。
念のため、メールの起こし方もメモしておきます。
#冒頭に前述にある以下を宣言しておく
#def get_schedule(num):
#def get_zendesk_update(num)
TodaysActions = [] #今日のアクションを格納する配列
get_schedule(TodaysActions) #スケジュールからアクティビティを取得
get_zendesk_update(TodaysActions) #受信ボックスからZendesk update を取得
dt_now = datetime.datetime.now()
outlook = win32com.client.Dispatch("Outlook.Application")
mail = outlook.CreateItem(0)
mail.subject = '{}/{} 在宅勤務を開始します'.format(dt_now.month,dt_now.day)
mail.to = 'jyoshi@com'
mail.bodyFormat = 1
TodaysActions = "\r\n".join(TodaysActions)# "\r\n" は改行してくれるオマジナイ
mail.body = "{}".format(TodaysActions) #メールの本文に TodaysActions を挿入
mail.display(True) ##手動メール送付
周囲の反応(リアクションを)を見つつ、継続して最適化を目指していきます。m(_ _)m
#追加リクエスト4
local な話で申し訳ない。
Zendesk のサポートシステムは、どんなアップデートもメールで知らせてくれる。
例えば、社内の関係者間のメールでのコミュニケーション、顧客からの返信、こちらからの回答 .. etc
アクティビィとして全部それらをリストしてメールの本文を貼ると以下のようになる。
■Zendesk
・#21348 (弊社返信) [質問] アルティマウェポンの入手方法
・#20845 (弊社返信) 評価boardライセンス及び PCIe に関して
・#21348 (顧客返信) [質問] アルティマウェポンの入手方法
・#20845 (弊社返信) 評価boardライセンス及び PCIe に関して
・#9799 (旧環境に新規問い合わせがありました。) カスタムマテリアルの生成方法について
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (弊社返信) [質問] アルティマウェポンの入手方法
・#21012 (顧客返信) (質問)効率的なマテリアルの育成方法について
・#21443 (新規)(組織未登録の顧客からのチケットが発行されました) 【超級武人破斬の入手方法】
受け取った方はどうだろう? 確かに一生懸命、仕事した感は伝わる。。
だが、重複してて見にくいのではないか?
っというわけで最適化の依頼が来た。
個人的には、文字処理の追加は特に遅くなるのでは?それが懸念だった。
極力 簡略化して、早くやりたい。。
とりあえず、以下でやってみることにした。
冒頭で引っ張ったメール情報 =>
エクセルに貼る =>
エクセルを python で制御(編集)=>
編集データをメールの本文に引っ張る
なんとなく、以下の手順でやってみた
Step1:すでに用意したエクセルファイルを開いて編集
split() を使って、番号と題名で区切った。
あとは、エクセルの特定の列(番号)を int に変換してpandas でソート。
そのあとは for 分で隣接する同一番号は、行単位で削除する。
文字で比較はしない。番号 + 本文 を文字として全部比較する処理は無駄の塊のような気がした。
Step2:編集したエクセルをソート
Step3:ソートしたセルを python 用の配列に詰めなおす
基本的には空のセルにぶち当たるまで、ソート済みの表から
str(番号)、本文の両方を "".join でくっつけてから格納した。
検証前のデータも参考に、改変後の結果をどうぞ。
###改変前
■Zendesk
・#21348 (弊社返信) [質問] アルティマウェポンの入手方法
・#20845 (弊社返信) 評価boardライセンス及び PCIe に関して
・#21348 (顧客返信) [質問] アルティマウェポンの入手方法
・#20845 (弊社返信) 評価boardライセンス及び PCIe に関して
・#9799 (旧環境に新規問い合わせがありました。) カスタムマテリアルの生成方法について
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21348 (弊社返信) [質問] アルティマウェポンの入手方法
・#21012 (顧客返信) (質問)効率的なマテリアルの育成方法について
・#21443 (新規)(組織未登録の顧客からのチケットが発行されました) 【超級武人破斬の入手方法】
###改変後
■Zendesk
・#21443 (新規)(組織未登録の顧客からのチケットが発行されました) 【超級武人破斬の入手方法】
・#21348 (内部メモ) [質問] アルティマウェポンの入手方法
・#21012 (顧客返信) (質問)効率的なマテリアルの育成方法について
・#20845 (弊社返信) 評価boardライセンス及び PCIe に関して
・#9799 (旧環境に新規問い合わせがありました。) カスタムマテリアルの生成方法について
かなりスッキリした。
一応、追加リクエスト4 を全部実行した時の時間を測った。
##elapsed_time:0.09820389747619629[sec]
追加リクエスト4 に応えるための上乗せ時間としては、まぁいいのかな。。
フィールドに展開して感想を募り、問題があれば別途検討します。。。
#最後に
昔から応援して下さった方、初めましての方々、LGTM、ストック、有難うございます。
とっても嬉しいです。
今後の予定では、今までの内容を網羅したコードを、
技術的に段階に分けて、git に挙げることを検討しています。
いつになるか分かりませんが、気長にお待ちください。