DataFrame内の特定カラムの型(type)を変換したい
解決したいこと
DataFrame内の特定カラムの型(type)を変換したい。
現状)
閲覧頂きありがとうございます。python初学者です。
現在、suumoの不動産データを用いて賃貸物件の家賃予測をしようとしています。
まず、floor(物件の所在階)の特徴量を作成しようとしているのですが、その段階でエラーが出ています。
データの確認
train.head(1)
title category address access age floor fee management_fee deposit gratuity madori menseki
0 ザ・東京タワーズミッドタワー 賃貸マンション 東京都中央区勝どき6 \n都営大江戸線/勝どき駅 歩5分\n東京メトロ有楽町線/月島駅 歩14分\n東京メトロ日比... \n築14年\n地下2地上58階建\n [12] 17.5万円 15000円 35万円 17.5万円 1LDK 51.78m2
train['floor'].head()
0 [12]
1 [10]
2 [11]
3 [13]
4 [20]
Name: floor, dtype: object
上記のように['floor']の中には、objectタイプでその物件の階数が表示されています。
私は1.[ ]を取りたい。2.タイプをobjectではなく数値(int)型にしたいと考えております。
自分で試したこと。
下記URLを参考に、astypeを用いて変換しようとしています。
https://note.nkmk.me/python-pandas-dtype-astype/
該当するソースコード
train = train.astype({'floor': 'int8'})
print(train)
エラー
ValueError: setting an array element with a sequence.
'int8'のシングルコーテーションを外したり、ただのintにしてもダメでした、、、
①どのようにしたら数値型に変換できるか。
②int8、int16、int64どれにするべきなのか。
上記2点に関して、解決方法をご存知の方がいらっしゃいましたら
ご教示の程宜しくお願い致します。
0