前提
ゴールとしてawsのs3にupされたcsvのファイルをlambdaで編集し再UPするものを作りたいので
手始めにローカル環境のpythonでcsvを編集する処理を試していきます
準備
サンプルとしてこのようなcsvファイルを用意しておきます
今回は「合計、平均、中央値」を追加してみます
実戦
main.py
import pandas as pd
import numpy as np
def change_csv(df):
# '国語', '数学', '理科', '社会', '英語'の列を抽出
subjects = ['国語', '数学', '理科', '社会', '英語']
subject_columns = df[subjects]
# 結果を新しい列としてDataFrameに追加
df['合計'] = subject_columns.sum(axis=1)
df['平均'] = subject_columns.mean(axis=1)
df['中央値'] = subject_columns.median(axis=1)
return df
# CSVファイルの読み込み
df = pd.read_csv('in.csv')
df = change_csv(df)
# 変換後のCSVファイルを保存
df.to_csv('out.csv', index=False)
print("CSVファイルが変換されout.csvとして保存されました。")
これで実行指定みるとout.csv出力されます
こんな感じで「合計、平均、中央値」が追加されました簡単ですね
おわり
csv周りの編集は色々と便利そうですs3にcsvを吐き出したりとしたい場合も多いので
lambdaので今回の処理のようにcsvを編集して再upするなどすると実現可能なことも多そうです