コンペに参加した際、pythonでcsvデータ(私の場合はExcelデータ)を読み込み、ファイルを開くのに苦労したのでメモを残しておきます。
環境:windows10, anaconda, jupyternotebook
まずは読み込みたいをデータのパスをPC上で確認します。
*パスとは"データがある場所"を示す文字列です。パソコン内における住所的なもの。
1.読み込みたいデータが入っているフォルダを開く
2.読み込みたいデータにカーソルを合わせ、右クリック
3.プロパティをクリック
4.左上の全般を押し、場所を確認。私の場合だと 場所:C:\Users\ユーザー名\Desktop\ファイル名1\ファイル名2\ファイル名3\ファイル名4\ファイル名5
注: \は¥という風に記述されている場合もあります。C:も、人によっては異なるアルファベットでしょう。またファイル名1,2,3...の数は人によって異なります。
5.パスを、C:は無視して、\Users\ユーザー名\Desktop\ファイル名1\ファイル名2\ファイル名3\ファイル名4\ファイル名5\読み込みたいデータのファイル名 とします。
注: ¥は\に書き換えてください。読み込みたいデータのファイル名は全般の一番上の段にも記述してあります。
以下に読み込むためのコードを記述します。
# まずはpandasをインポート
import pandas as pd
# データの名前をdfとし、読み込みます。
# \を文字として使用する場合は、\がエスケープ文字として処理されないように、raw文字列指定にします、すなわちr"パス名"としています。
df = pd.read_csv(r"\Users\ユーザー名\Desktop\ファイル名1\ファイル名2\ファイル名3\ファイル名4\ファイル名5\読み込みたいデータのファイル名")
# データの先頭5行をを表示してみる
df.head()
データの形式がExcel(csv)の場合、パスの読み込みたいデータのファイル名は、読み込みたいデータのファイル名.csv としましょう。
以上です。
”\を文字として使用する場合は、\がエスケープ文字として処理されないように、raw文字列指定にします、すなわちr"パス名"としています。”
→こちらに関しましては、2020/9/2に@shiracamus様からご指摘頂きました、ありがとうございます。
何かご指摘ございましたら、よろしくお願いいたします。