1. はじめに
山間部に行くとキャリアによってスマホが繋がりにくくなったり、都市部でも回線によってはオンラインゲームに支障が出るほどラグがあったり...といった話をよく聞きます。回線品質の地域分布が気になったので、実際に調べてみました。
2. 回線速度とPingを集める
こちらのサイトからデータを集めました。
スクレイピングはBeautifulSoupを用いました。取得するデータを絞る、time.sleepに余裕を持たせるなどしてサーバに負荷をかけないようにお願いします。
集めたデータを整形し、このような表を得ました。時刻、戸建or集合住宅、プロバイダ、有線or無線などの情報もありますが、スペースの関係で割愛します。
Date | Pref | City | Jitter | Ping | Download | Upload |
---|---|---|---|---|---|---|
2023年07月01日 | 神奈川県 | 茅ヶ崎市 | 1.33 | 8.0 | 1372.42 | 867.58 |
2023年07月01日 | 宮城県 | 仙台市太白区 | 11.66 | 15.7 | 74.61 | 96.74 |
2023年07月01日 | 京都府 | 京都市伏見区 | 2.13 | 16.3 | 238.18 | 666.09 |
... |
ただし、JitterとPingの単位はms、DownloadとUploadはMbpsです。
このデータを可視化していきます。
3. 可視化
3.1. ライブラリ
地図データを扱う上で、もっともシンプルであろうGeopandasを採用しました。その他にも、インタラクティブな地図を作れるfoliumや、海外線、陸地、政治的境界線などの様々な特徴を表示可能なCartopyなどのライブラリがあります。
3.2 地図情報
地図情報は国土交通省の下記サイトから拝借しました。
必要に応じて全国か都道府県のデータをダウンロードしてください。今回は埼玉県と東京都のデータを使いたいので、
N03-20230101_11_GML.zip (埼玉県)
N03-20230101_13_GML.zip (東京都)
をダウンロードします。
圧縮ファイルを解凍すると、*.geojsonという地理空間データがあるのでこれを使います。
埼玉の場合を例にとり、中身を確認してみます。pathは自身の環境に合わせて適当に設定してください。
import geopandas as gpd
import matplotlib.pyplot as plt
#読み込み
geo_saitama = gpd.read_file(f"{path}/N03-23_11_230101.geojson", encoding="SHIFT-JIS")
#中身確認
geo_saitama.head() # (81,6)
N03_001 | N03_002 | N03_003 | N03_004 | N03_007 | geometry |
---|---|---|---|---|---|
埼玉県 | NaN | さいたま市 | さいたま市西区 | 11101 | POLYGON ((139.54776 35.93420, 139.54720 35.934... |
埼玉県 | NaN | さいたま市 | さいたま市西区 | 11101 | POLYGON ((139.54776 35.93420, 139.54720 35.934... |
埼玉県 | NaN | さいたま市 | さいたま市北区 | 11102 | POLYGON ((139.61753 35.96486, 139.61798 35.964... |
... |
さいたま市西区が2つあったり、本来72個のデータだと思われるのに81個あるのはよくわかりませんが...
3.3. 埼玉県における光回線のマッピング
2.で集めたデータから、各市町村における中央値を出してみました。相関係数行列によると、ダウンロードとアップロードは正の相関がありますが、回線の安定性とはあまりない/弱い相関程度のようです。
これと3.2.の地理空間データを統合し、マッピングしてみます。
市町村によって値が大きく異なるため、対数表記にしました。今回は相対的な差を可視化したいのでこれでよしとします。
埼玉県事情がよくわかりませんが、回線が速い/遅いと安定/不安定の組み合わせから、回線インフラに対して人口が多い/少ないのような情報も見えるかもしれません。
今回は1万件程度のデータを集めましたが、もっとデータを集めれば、プロバイダごとの違いも可視化できますね。
3.4. 東京都におけるモバイル回線のマッピング
同様に東京都のデータも確認してみます。NTTドコモ、au、Softbank、楽天のデータを合計で約30000件集めました。ダウンロード速度の中央値をそれぞれマッピングしてみます。スケールは統一してあります。
4. まとめ
回線の情報をスクレイピングで集めて、geopandasで可視化しました。
- 埼玉県の光回線は、有線/無線接続を問わずです
- 回線の品質は、測定の時間や戸建や集合住宅などにも大きく依存するはずです
上記の点に留意し、参考程度に見てください。