はじめに
データ分析の独学をするときに環境としてAWSのRedshiftを使おうとしたが、
そもそも初心者なので、色々と手こずった。久しぶりメモとして投稿。
ロール作成
Identity and Access Management (IAM)にルールを決めることができるので、
AmazonS3ReadOnlyAccessのみを利用できるルールを作る。
クラスタ作成
Redshiftは無料枠があるので、それを利用する。
クイック起動して、ロールを設定してあげる。
Query editor
データベースの接続をする(初回のみ)クラスタの設定見れば問題ない。
あとは普通のデータベースと同じ。テーブル作る。
S3にアップロード
特記ない。
S3から読み込む
コピーコマンド
COPY 'テーブル名'
FROM 's3のパス'
IAM_ROLE 'ロール名'
IGNOREHEADER 1
CSV;
これでエディタで確認できればOK。
無理ならエラーコマンド一つずつ潰すのみ。
参考