Mavmed
@Mavmed

Are you sure you want to delete the question?

If your question is resolved, you may close it.

Leaving a resolved question undeleted may help others!

We hope you find it useful!

フォルダ内の複数のCSVファイルをまとめて編集し、結合したいです

質問内容

スクリーンショット 2022-05-03 16.22.43.png
上記のようなCSVファイルが、フォルダのなかに(P-0000012)という名前(識別番号です)で格納されています。タイトル名はフォルダ名と同じでP-0000012です。このCSVファイルを[Genes, Mutation Type]のみにして下図のようにしたいです。
スクリーンショット 2022-05-03 16.24.50.png
 これ一つであれば、手作業でできますが、この操作を同じフォルダ内の数百のCSVファイルに対して繰り返しで行い、最終的に結合するのが目的です。元のファイルの次元が多すぎて、これをどのように削減してID×Genesの表にすれば良いか、ご教示いただきたく存じます。
 環境としては、Mac OS(Arm64), 主な使用言語はR, Pandasです。

0

1Answer

AWK でやってみました.

convert.awk
#!/usr/bin/awk -f

BEGIN {
    FS  = ","
}

FNR == 1 {
    if (NR != 1) printf("\n")  # Terminate previous line

    id = FILENAME
    gsub(/(^.*\/|\.csv$)/, "", id)  # Basename without extension
    printf "%s", id
    next
}

{
    printf ",%s", $3  # Mutation type
}

END {
    printf "\n"
}

次のようなコマンドで変換後の CSV ファイルができます.
ただしヘッダー行はありませんので,必要ならば別途挿入してください.

awk -f convert.awk path/to/folder/*.csv >out.csv
0Like

Your answer might help someone💌