TCGAのデータをChAMPで読み込むをかいたのでついでにGEOも書いておきます。こっちはとても簡単なのですが。
GEOからデータをダウンロード
GSE77965を例にとります。Supplementary fileからGSE77965_RAW.tarのcustomを選んでファイル名がidat.gzで終わっているファイルを選択してGSE77965_RAW.tarを作成し、ダウンロードしカレントディレクトリに展開して下さい。
Sample_Sheet.csvの作成
ファイル名は
GSM2062665_7796806124_R01C01_Grn.idat.gz
などとなっているはずなのでそこの7796806124とR01C01の部分を使って
Sample_Name,Sample_Group,Sentrix_ID,Sentrix_Position
T1,Tumor,7796806124,R01C01
T2,Tumor,7796806124,R02C01
T3,Tumor,7796806124,R03C01
T4,Tumor,7796806124,R04C01
T5,Tumor,7796806124,R05C01
T6,Tumor,7796806124,R06C01
N1,Normal,7796806124,R01C02
N2,Normal,7796806124,R02C02
N3,Normal,7796806124,R03C02
N4,Normal,7796806124,R04C02
N5,Normal,7796806124,R05C02
N6,Normal,7796806124,R06C02
という形式のファイルを作成します。
読み込み
>require(ChAMP)
>myLoad <- champ.load("./",arraytype="450K")
で読み込めます。