主にリンク集です
マルチ
EMBL-EBI Sequence Format Conversion
Web上のコンバータ、EMBOSS seqret と MView。あらゆるフォーマットが変換可能。
SeqretでInput/Output 可能なフォーマット List Formats
bioconvert
Pythonプログラム、pip, condaインストール
Available Converters の図を見るとすごいけど動作未確認(すみません)
Genbank
Genbank to FASTA
-
perlスクリプト gb2fasta.pl
-
EMBOSS seqret Command line
seqret in.gbk out.fasta
GFF3 to Genbank
- pythonスクリプト gff_to_genbank.py
GFF3, GTF, BED
gffread
Cufflinks から独立してた
GFF3 to GTF
gffread my.gff3 -T -o my.gtf
GTF to GFF3
gffread -E my.gtf -g my_genome.fa -o my.gff3
GFF3 + Genome to FASTA (exons.fa, cds.fa and protein.fa)
gffread -E my.gff3 -g genome.fa -w my_exons.fa -x my_cds.fa -y my_protein.fa
BEDOPS
Data conversion (フォーマット変換できるものの説明)
GFF3 to BED
cat my.gff3 | gff2bed > my.bed
GTF to BED
cat my.gtf | gtf2bed > my.bed
sam to BED
cat myread1.sam | sam2bed > my.bed
wig to BED
cat my.wig | wig2bed > my.bed
NGS 周り(fastq, bam, sam, wig)
Seqkit
FASTQ to FASTA
seqkit fq2fa myreads.fq.gz -o myreads.fa.gz
samtools
sam to bam (with sorting)
samtools sort -O bam -o myreads1.bam myreads1.sam
Make index on bam
samtools index myreads1.bam
Augustus
bam to wig
python3 augustus_dir/scripts/bamToWig.py -b myreads1.bam -g genome.fa -o myreads1.wig
BED Graph to wig
perl augustus_dir/scripts/bedgraph2wig.pl --bedgraphfile=myreads1.bed --outputfile=myreads1.wig
BEDOPS
wig to BED, sam to BED
上記参照