GC skewとは
GC skewとは、ゲノムDNA上のグアニン(G)とシトシン(C)含量の偏りのこと。
GC skew = (G - C)/(G + C)
GC skew (下図青線)の累積 (cumulative GC skew; 下図橙線) は、複製開始点から終結点にかけてだんだん上がっていく/下がっていく(計算する鎖がリーデイング鎖かラギング鎖かによる)。Cumulative GC skewの変曲点 (下図赤線) が複製起点または終点に対応することが多い。
plot_skew.py
Generate dinucleotide skew plot(s) of FASTA format DNA sequences in SVG format. Plots are saved separately for each entry in a multifasta file
Requirements
Usage
$ ./plot_skew.py
usage: plot_skew.py [-h] -i INPUT [-n NT] [-w WINDOW] [-s STEP]
Generate dinucleotide skew plot(s) of FASTA format DNA sequences in SVG format. Plots are saved separately for each entry in a multifasta file
optional arguments:
-h, --help show this help message and exit
-i INPUT, --input INPUT
Fasta (required)
-n NT, --nt NT dinucleotide (default: GC).
-w WINDOW, --window WINDOW
window size (default: 1000)
-s STEP, --step STEP step size (default: 100)
Example: Escherichia coli str. K-12 substr. MG1655, complete genome NC_000913.3
$ ./plot_skew.py NC_000913.3.fasta # (output: NC_000913.3.svg)