開始
make file
conda create -n unicycler
conda activate unicycler
install [fastp / fastqc / bandage]
conda install -c bioconda fastp
conda install -c bioconda fastqc
conda install -c bioconda Bandage
make directory こっからunicyclerに入っててね
mkdir unicycler
cd unicycler
ファイルがgzで圧縮されてるのでそれを解く
unicycler$ gunzip G1_S41_L001_R2_001.fastq.gz
unicycler$ gunzip G1_S41_L001_R2_001.fastq.gz
fastqcで今の状況を見て、トリミングする
fastqc
・クオリティ25以下は切り捨て
・G1_S41_L001_R1_001.fastq→→→trimG1_S41_L001_R1_001.fastq.gz
初めの25と後ろ10をトリム
・G1_S41_L001_R2_001.fastq→→→trimG1_S41_L001_R2_001.fastq.gz
初めの25と後ろの100をトリム
fastp -i 1_S1_L001_R1_001.fastq.gz -I 1_S1_L001_R2_001.fastq.gz -o trim1_S1_L001_R1_001.fastq.gz -O trim1_S1_L001_R2_001.fastq.gz -e 30 -q 30 -l 20 -3 -M 30 -T 1 -t 1
unicyclerのインストール
conda install -c bioconda unicycler
unicyclerでデータ処理してもらう。それをOutputs1_dirというディレクトリに入れてもらう
unicycler -1 trimG1_S41_L001_R1_001.fastq.gz -2 trimG1_S41_L001_R2_001.fastq.gz -o outputs1_dir
Bandageで、つながったか見てみる
Bandage
以上
いいサイト
chacking gene qality by FASTQC
fastqc
disccuss which point should be removed
https://olvtools.com/documents/fastqc
cut bad qality place by Fastp
(this time)
R1_001 cut 1-20, 215-301
R2_001 cut 1-20, 195-301
fastp -i G1_S41_L001_R1_001.fastq.gz(fail_name) -I G1_S41_L001_R2_001.fastq.gz \
-o G1_S41_L001_R1_001.fq.gz -O G1_S41_L001_R2_001.fq.gz \
-h report.html -j report.json -q 30 -t 1 -T 1 -l 20 -w 8
-3 :3’側のトリミングを許可
-q :指定QVを下回ったらカット
-n :Nを指定数だけ許容
-l :トリミング後に長さが指定長さ以上なら許容。以下ならそのリードを捨てる
-t :read1末尾を指定した数だけ削る
-T :read2末尾を指定した数だけ削る
-w :CPUのスレッド数
–detect_adapter_for_pe :ペアエンドの際のadapterトリミング
-i or -I : input file
-o or -O : output file]