0
1

不動産データをPythonで分析してみる

Last updated at Posted at 2024-08-20

種類別の不動産の取引価格割合を調べる

ある地域で現在売りに出されている不動産のうち、どんな種類がどの価格割合で売られているか調べます。
中古マンション、宅地(土地+建物)、土地のみ、林地 などの不動産で、どの種類の取引価格割合が多いでしょうか。

データを取得する

下記サイトからサンプルデータを取得してきます。
好きな地域を指定して、種類は比較するために「すべて」を選択してください。
時期は5年分程度を取得するとある程度傾向を知ることができるのではないでしょうか。
(統計学について詳しくないので、知りたい結果を得るためにどれ程ののデータが必要なのかはわかりません。残念ですね。)

Screenshot 2024-08-20 145502.png

自分の近所のデータとかでも面白いかも。

Shift_JIS から UTF-8 に変換

データ処理のために下記処理でエンコードを変換してください。

input_file = "きみがとってきた.csv"
output_file = "きみがとってきた_utf8.csv"

with open(input_file, 'r', encoding='shift_jis', errors='replace') as f_in:
    content = f_in.read()

with open(output_file, 'w', encoding='utf-8') as f_out:
    f_out.write(content)

print("エンコーディングの変換が完了しました。")

確認してみる

# データを読み込む
df = pd.read_csv(output_file)
print(df.head())

結果

         種類  価格情報区分   地域  市区町村コード 都道府県名  市区町村名   地区名    最寄駅:名称 最寄駅:距離(分)  取引価格(総額)  坪単価   間取り  ... 建物の構造   用途 今後の利用目的 前面道路:方位  前面道路:種類 前面道路:幅員(m)  都市計画 建ぺい率(%) 容積率(%)        取引時期   改装  取引の事情等
0  中古マンション等  成約価格情報  NaN     1107   北海道  札幌市西区  琴似4条  琴似(札幌市営)         9  24000000  NaN  4LDK  ...   SRC  NaN     NaN     NaN      NaN        NaN  1種住 居     NaN    NaN  2021年第3四半期  NaN     NaN
1  中古マンション等  成約価格情報  NaN     1107   北海道  札幌市西区  琴似4条  琴似(札幌市営)         6  21000000  NaN  3LDK  ...    RC  NaN     NaN     NaN      NaN        NaN  1低住専     NaN    NaN  2021年第3四半期  NaN     NaN
2  中古マンション等  成約価格情報  NaN     1107   北海道  札幌市西区  琴似4条  琴似(札幌市営)         6  23000000  NaN  3LDK  ...    RC  NaN     NaN     NaN      NaN        NaN  1種住居     NaN    NaN  2021年第3四半期  NaN     NaN
3  中古マンション等  成約価格情報  NaN     1107   北海道  札幌市西区  西野2条       発寒南        10   3000000  NaN  3LDK  ...    RC  NaN     NaN     NaN      NaN        NaN  近隣商業     NaN    NaN  2021年第3四半期  NaN     NaN
4  中古マンション等  成約価格情報  NaN     1107   北海道  札幌市西区  西野2条       発寒南        12   2000000  NaN   3DK  ...    RC  NaN     NaN     NaN      NaN        NaN   NaN     NaN    NaN  2021年第3四半期  NaN     NaN

文字化け対応

文字化けを直すため置換します。

df.rename(columns={'延床面積(�u)': '延床面積(㎡)'}, inplace=True)

整形後のデータ確認

print(df.describe())
       市区町村コード      取引価格(総額)           坪単価     取引価格(�u単価)   前面道路:幅員(m)      建ぺい率(%)       容積率(%)
count   6714.0  6.714000e+03  1.800000e+03    1800.000000  4276.000000  5581.000000  5581.000000
mean    1107.0  3.237656e+07  3.082100e+05   93198.261111     9.389874    61.058950   193.406200
std        0.0  5.540421e+07  1.724856e+05   52277.547987     6.038094     9.803094    72.718769
min     1107.0  3.000000e+04  8.400000e+02     260.000000     2.500000    30.000000    60.000000
25%     1107.0  1.300000e+07  1.900000e+05   59000.000000     6.500000    60.000000   200.000000
50%     1107.0  2.200000e+07  2.900000e+05   88000.000000     8.000000    60.000000   200.000000
75%     1107.0  3.400000e+07  3.925000e+05  120000.000000    10.000000    60.000000   200.000000
max     1107.0  1.500000e+09  2.900000e+06  880000.000000    88.000000    90.000000   500.000000

グラフとして表示する

種類ごとに合計金額を .groupby("種類").sum()

で求め

df["x軸ラベル"].plot.pie(y="y軸ラベル")

で円グラフとして表示する。

df_tmp = df.groupby("種類").sum()
df_tmp["取引価格(総額)"].plot.pie(y="取引価格(総額)")
plt.show()

結果

一番割合が多いのは宅地(土地と建物)でした。二番目は土地ですね。
建物を取り壊さずそのまま土地と一緒に売りに出すケースが多いようです。
建物壊すのにもお金かかりますしね。

土地の取引価格割合のほうが中古マンションより大きいので空き地がけっこうあるのかもしれません。
これは面積で比較したほうがいいので今度やってみたいと思います。
もう少し、いろいろな値を基準に比較してこのデータから何がわかるか今度調べてみたいです。

Screenshot 2024-08-20 151543.png

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1