More than 1 year has passed since last update.

SUUMOにて割安賃料物件を見つけよう_モデル作成編

Last updated at 2024-06-15Posted at 2024-05-15

概要

SUUMOにて割安な賃料物件を探しました。

調査の流れ

調査は以下の3つに分割しました。

モデル作成

使用データ

SUUMOからスクレイピングしたデータ
地価公示データ
駅別乗降客数

データ探索

被説明変数である賃料と、説明変数である建物種別、築年数、総戸数、階建て、公示地価、駅関連の情報、間取り、専有面積、階数のデータを探索する。
(説明数変数についてすべて記事にすると長くなってしまうので代表的なものに絞った。)
(同様の理由で今回探索するのは三軒茶屋のデータである。)

賃料

賃料の分布は右裾の長いものであった。
変動係数を計算すると0.491であった。
そこで分布の散らばりを抑えるためにlog(賃料/専有面積)という変換を施す。

log(賃料/専有面積)

log(賃料/専有面積)の分布の形状は正規分布のようになった。
変動係数を計算すると0.0232となり、賃料に比べるとデータの散らばりを小さくすることができた。
今回のモデルの被説明変数はlog(賃料/専有面積)(以下log_平米単価と表記)に設定する。

建物種別

マンションとアパートでlog_平米単価の分布を比較した。
マンションは8.3あたりに、アパートは8.1あたりに集中しておりマンションの方が平均して賃料が高いことということがわかる。

築年数

横軸が築年数で、縦軸をlog_平米単価として散布図を描画した。
見ての通り、右肩下がりであり築年数が大きいほどlog_平米単価は下がるということがわかる。
相関係数を計算すると-0.58であった。

総戸数

横軸が総戸数で、縦軸をlog_平米単価として散布図を描画した。
外れ値があり、両者の関係が見えづらくなっていたので総戸数<100という制約を加えている。
傾きは小さいが、若干右肩上がりになっている。(相関係数は0.381)
建物の規模が大きくなれば部屋の大きさも比例して大きくなり、その分賃料が上がるのは自然である。

階建て

横軸が階建てで、横軸をlog_平米単価として散布図を描画した。
こちらも総戸数と同様の理由で若干賃料と比例することが推測できる。(相関係数は0.265)

公示地価

町村以前の住所ごとの公示地価とlog_平米単価の平均を求めた。
横軸が公示地価で、横軸をlog_平米単価として散布図を描画した。
両者は右方上がりの関係であり、公示地価は賃料に影響を与えることがわかる。
土地の価格が高ければその上に立つ建物の賃料が上がるのも自然である。
相関係数は0.534であった。