Change-Oとは
igbalstなど、V(D)Jアラインメントツールの出力を処理し、クローンクラスターを免疫グロブリン(Ig)配列に割り当て、そして生殖系列配列を再構築するためのツールの集まりです。
igblastのアウトプットは非常に見づらいので、その後のChange-OのMakeDb.pyで見やすいフォーマットに変換します。
Change-Oのダウンロード
pip3 install changeo --user
もしくは以下でもダウンロードできます。
wget https://bitbucket.org/kleinstein/changeo/downloads/changeo-0.4.4.tar.gz
tar zxvf changeo-0.4.4.tar.gz
export PATH="$PATH:/PATHTOCHANGEO/changeo-0.4.4/bin"
igblast
まずは、Change-Oをするまえに、igblastでアノテーションを行います。
igblastの設定は以下の通りです。
igblastn \
-germline_db_V ~/share/igblast/database/imgt_human_ig_v\
-germline_db_D ~/share/igblast/database/imgt_human_ig_d \
-germline_db_J ~/share/igblast/database/imgt_human_ig_v \
-auxiliary_data ~/share/igblast/optional_file/human_gl.aux \
-domain_system imgt -ig_seqtype Ig -organism human \
-outfmt '7 std qseq sseq btop' \
-query S43_atleast-2.fasta \
-out S43_atleast-2.fmt7
IMGT-gapped リファレンスシーケンスの作成
以下のウェブサイトから、適切なシーケンスをダウンロードします。
http://www.imgt.org/vquest/refseqh.html
例は以下の通りです。
# Human TCR
## TRA
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRAV.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRAJ.fasta
## TRB
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRBV.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRBD.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRBJ.fasta
## TRD
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRDV.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRDD.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRDJ.fasta
## TRG
## TRD
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRGV.fasta
wget http://www.imgt.org/download/V-QUEST/IMGT_V-QUEST_reference_directory/Homo_sapiens/TR/TRGJ.fasta
cat TR?V.fasta > human_tr_v.fasta
cat TR?D.fasta > human_tr_d.fasta
cat TR?J.fasta > human_tr_j.fasta
MakeDb.py
igblastのアウトプットを見やすい形にするには、MakeDb.pyをかけます。コマンドは以下の通りです。
MakeDb.py \
igblast \
-i S43_atleast-2.fmt7 \ #igblastのアウトプット
-s S43_atleast-2.fasta \ #igblastをかける前のfastaファイル
-r human_tr_v.fasta human_tr_d.fasta human_tr_j.fasta \ #上記で作成したリファレンスシーケンス
--regions \
--scores
アウトプット
アウトプットファイルは、ibglastのアウトプットファイルと同じディレクトリに作成されます。名前はigblastの後ろに"_db-pass.tab"がつきます。