データ分析、初歩の初歩 - 開発は顧客問合せへの工数をどうすれば減らせるのか

Posted at 2021-04-20

表題に対しデータをちゃんと取って作戦をたてたいと思い、考察した内容。ポエムに近い。

数と率

比較
分布
時系列
相関関係と因果関係

だよねえ、と思いながら色々こねくり回してみた。が、まだまだ考える余地がある。

動機

ざっくりと話の前提

開発チームは保守・安定Version、最新Versionと、複数Versionに跨り
- 不具合修正作業
- コーディング
- 調査
  - etc
  - ...をしながら
- 問合せ解決のための「やりとり」、コミュニケーション
  - ...もこなしている。その役割分担が無理ゲーではという話はここではしない。まずはそういう状況下にあるとする。
しかし当然、プログラムをより良くする上では、もっと実際の作業（開発者しかできない、手を動かす作業、あわよくば技術の探求、勉強）に時間を裂きたい。
- 「やりとり」なんかは最小限のほうが良い、とその所属メンバーである私は思っている。
- コミュニケーションしたくないという意味ではない。それもう何回も言ってるよ～というのを無くしたいのです。
その他
- 社内には開発の他に、顧客問合せを爆速で水先案内するいわゆるコンタクトセンターチームが居る。
- 開発も、もう少しシステマチックに保守・安定Version問合せに対応する手続きが確立できれば、それ専任の人員を追加アサインすることを上司に提案できるんだが。

やりたいこと

開発チームが保守Versionの問合せのやりとりに割く時間割合が多すぎるのでは、という仮説をデータから可視化したい
- ここを駆逐できればもっと開発に時間を裂けるのではないかという仮説
- 可視化すれば駆逐するにはどういう作戦が考えられるか、考えやすくなるのではという仮説
淡い期待: コンタクトセンターにもっと依頼できるのでは。
淡い期待: あるいは、「コンタクトセンターから溢れるが開発の中ではルーチン作業となっている」ゾーンがまだまだあるのでは。

つまりそれほど難しい分析学を身に着けたいと言うほどではないが、
自分の仮説に根拠と裏付けをつくるためにそれなりに現在の状況を可視化したい。
ちょっとこなれたExcel使い程度のことをExcelではない方法でやれたらいいな。などと思ったということです。自分のために。

やってみる

自分の担当分野に関する問い合わせをCSV形式で取得した。こんな感じになる。
実際は1000の桁のレコードがあるので結構色々数字遊びができる。

記入者	区分	更新日時	更新日	プロダクト	バージョン	サブシステム	URL
磯野カツオ		2021/01/15 23:45	2021/1/15	Great Product	安定Ver	ツール	https://xx.examples.com/examples=zzzz
フグ田サザエ		2021/01/15 23:27	2021/1/15	Great Product	安定Ver	汎用検索	https://xx.examples.com/examples=zzzz
さくら友蔵様	お客様	2021/01/15 23:19	2021/1/15	Great Product	最新Ver	汎用検索	https://xx.examples.com/examples=zzzz
フグ田タラオ		2021/01/15 23:06	2021/1/15	Great Product	最新Ver	未設定	https://xx.examples.com/examples=zzzz
磯野波平		2021/01/15 23:05	2021/1/15	Great Product	最新Ver	共通	https://xx.examples.com/examples=zzzz
...	...	...	...	...	...	...	...

たとえば上の例で、「安定Ver」のレコードをどうにかできないものかと思うわけですね。~~だって単純作業の塊だから...~~

全顧客問い合わせ数

全顧客問い合わせ数における各Version 毎の割合を出してみよう。
PythonでとりあえずCSVからカウントしてみようと思った
- （Excelで集計できるけど。このあたりまあやってみたかっただけ。）
- （安定Versionがよく問い合わせを受けているねということです。）

バージョン	件数	割合 (%）
安定Ver	3992	57.6711933
最新Ver1	1484	21.43889049
最新Ver2	655	20.88991621

count.py

import pandas as pd
import sys

args = sys.argv
print(args)
print("第1引数：" + args[1])
print("第2引数：" + args[2])

def countbyversion():
    df = pd.read_csv(args[1], header=0, parse_dates=['更新日'])
    ret = df.groupby(['バージョン']).agg({'URL':'count'})
    ret.to_csv('output.csv', index=True, header=True)

if (args[2] == "countbyversion"):
    countbyversion()

開発チームの回答数

開発チームの回答数における各Version ごとの割合
- これをみて、ホラッ、私達の仕事の4割は安定Versionとの闘いじゃない、と思ったりするのだ。が。

記入者	バージョン	件数	回答数に占める安定Versionの割合(%)
磯野カツオ	安定Ver	18	40.90909091
磯野カツオ	最新Ver1	16
磯野カツオ	最新Ver2	9
フグ田サザエ	安定Ver	30	42.25352113
フグ田サザエ	最新Ver1	19
フグ田サザエ	最新Ver2	12
磯野波平	安定Ver	10	35.71428571
磯野波平	最新Ver1	3
磯野波平	最新Ver2	11

def countbypersonandver():
    df = pd.read_csv(args[1], header=0, parse_dates=['更新日'])
    ret = df.groupby(['記入者', 'バージョン']).agg({'URL':'count'})
    ret.to_csv('output.csv', index=True, header=True)

コンタクトセンターの回答数

コンタクトセンターの回答数における各Version ごとの割合
- あれ、コンタクトセンターの回答数、むしろ7割が安定Versionに関するところなのか...。

記入者	バージョン	件数	回答数に占める安定Versionの割合(%)
磯野タラオ	安定Ver	200	71.42857143
磯野タラオ	最新Ver1	56
磯野タラオ	最新Ver2	18
磯野タイコ	安定Ver	204	73.91304348
磯野タイコ	最新Ver1	55
磯野タイコ	最新Ver2	12
磯野ノリスケ	安定Ver	72	75.78947368
磯野ノリスケ	最新Ver1	15
磯野ノリスケ	最新Ver2	2

安定、下位Versionと戦っている割合

こんな感じだった。

開発： 40 %前後
コンタクトセンター：70 %前後

つまり

コンタクトセンターは下位Versionの問合せを結構吸収してくれているのだな...
だいぶ肌感と違ったな...いやいや、でもこれで正しく作戦が立てられるのだ。そう思うことにする。
開発の私としてはこの割合を限りなく1桁パーセントにしたい。

冒頭に戻り、本当のやりたいこと

開発チームが保守Versionの問合せのやりとりに割く時間割合が多すぎるのでは、という仮説をデータから可視化したい
- ここを駆逐できればもっと開発に時間を裂けるのではないかという仮説
- 可視化すれば駆逐するにはどういう作戦が考えられるか、考えやすくなるのではという仮説

~~淡い期待: コンタクトセンターにもっと依頼できるのでは。~~ とおもったがそうでもなかった。
淡い期待: あるいは、「コンタクトセンターから溢れるが開発の中ではルーチン作業となっている」ゾーンがまだまだあるのでは。
気づいたこと: そういえば普通に各Version毎の利用数どれほどだっけ
気づいたこと: 3月4月のほうが忙しいんだよね、そのへんどうだっけ
気づいたこと: 各Versionだけじゃなく詳細機能別とかどうだっけ

が次の作戦になりそう。

学び

冒頭のデータを見るときに気をつけていることをもう一度見ると、当記事では以下が触れられていない。

分布

時系列

相関関係と因果関係

実際には時期別特徴や、Version毎の利用数から問合せに至る率、単に数が多ければ問合せも多いだろうという関係や、プロダクトの中の詳細機能ごとの特徴なども考えてよさそうだ。さらには、この安定Versionに対して開発が対応したところで実際、プログラムの修正はどれだけ必要なのか？なども考えたい。

ただの感想: しかしこういうの実際に数字にしてみないと気づけなかったなあ。ともかく、「コンタクトセンターから溢れるが開発の中ではルーチン作業となっている」ゾーンは何か？具体的に見てみようとおもう。これに気づけてよかった。ここから先は具体的になっていってしまうのでこのお話はこのへんで。

以上参考になればさいわいです

参考

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up