#はじめに
以前に書いたPrologファイルを整理していましたら、生物のDNAをPrologで操作するプログラムが見つかりました。思い出しつつご紹介したいと思います。
#生物の復習
40年前に習った「生物」を思い出しつつ用語を整理します。
塩基 A(アデニン) T(チミン) G(グアニン) C(シトシン)
U(ウラシル) シトシンの一部が水と反応するとウラシルになります。
このATCGの4文字を3つ組み合わせであるRNAで、タンパク質のもととなるアミノ酸を表しています。例えばCGUはアルギニンを意味します。 参考 http://kakusan-drink.jp/about/index2.html
この塩基の暗号は「ここから」という記号で始まり、「ここまで」という記号で終わります。「ここから」という塩基はメチオニンと同じAUGです。「ここまで」はUAA,UAGです。
DNAは二重らせんになっています。複製を作るときは2本を1本つづに切り離します。そして、それぞれについて個々の塩基に対応する塩基をつないでいって1本にし、古いDNA列をくっつけて2本にします。1本のDNA列から2本のDNA列が生成され、それぞれは古いものと転写された新しいものとで構成されています。参考 http://blog.livedoor.jp/crazybio/archives/42047664.html
#金物表現
Prologでは大文字は変数と解釈されますので、塩基ATCGはa t c gの記号アトムで表現します。
アミノ酸は次のように略記します。
phe フェニル
ala アラニン
leu ロイシン
ile イソロイシン
met メチオニン
val バリン
ser セリン
pro プロリン
thr トレオニン
ala アラニン
tyr チロシン
his ヒスチジン
gln グルタミン
asn アスパラギン
lys リシン
asp アスパラギン酸
glu グルタミン酸
cys システイン
trp トリプトファン
arg アルギニン
#工夫
メチオニンを意味する塩基の組み合わせは、「ここから」という目印の意味にも使われています。そこで解読開始した後にAUGで出現した場合にはメチオニンを返し、そうでなければ開始記号を意味するbegin記号アトムを返すことにしました。「ここまで」の塩基に対してはend記号アトムを返すことにしています。
#実行
RNAからアミノ酸に変換します。
| ?-data(X),rna_amino(X,Y).
X = [a,u,g,c,g,c,a,a,u,g,u,g,u,a,a],
Y = [begin,arg,asn,val,end]
yes
|
Prologは逆方向への計算も可能です。ですから、アミノ酸からRNAを求めることもできます。
| ?-rna_amino(X,[begin,arg,asn,val,end]).
X = [a,u,g,c,g,u,a,a,u,g,u,u,u,a,a]
yes
|
DNA列からRNA列を生成します。
| ?-dna_rna([t,t,g,c,g,a,t],X).
X = [a,a,c,g,c,u,a]
yes
|
アミノ酸からDNAの二重らせんを生成します。
| ?- make_dna([arg,asn,val],X).
X = [[g,c],[c,g],[a,t],[t,a],[t,a],[a,t],[c,g],[a,t],[a,t]]
yes
|
どうも、バグがありそうです。生物の教科書とよく見比べてデバッグをお願いいたします。
生命の仕組みというのは、とても巧妙に精緻にできているものだと、改めて感心させられてしまいます。受験勉強としての「生物」に飽きたら、Prologで楽しんでみてください。デバッグすることでDNAに対する深い理解が得られたら望外の喜びです。
#参考文献
「DNAの構造とはたらき DNA図書館へようこそ」 羽馬有紗 前田龍一郎 ベレ出版
#コード
%DNAコードをアミノ酸の名称に変換。
%参考 「DNAの構造とはたらき」(べレ出版)
%テストデータ
data([a,u,g,c,g,c,a,a,u,g,u,g,u,a,a]).
%変換中であるかどうかの大域変数。beginかmet(メチオニン)かの判定で必要。
:- dynamic(trans/1).
trans(off).
%RNA列をアミノ酸名に変換する。逆変換も可能。
rna_amino([],[]) :-
abolish(trans/1),
assert(trans(off)).
rna_amino([A,B,C|Xs],[Z|Zs]) :-
dnaward([A,B,C],Z),
trans(on),
rna_amino(Xs,Zs).
rna_amino([A,B,C|Xs],[Z|Zs]) :-
dnaward([A,B,C],Z),
abolish(trans/1),
assert(trans(on)),
rna_amino(Xs,Zs).
%RNAとそれに対応するアミノ酸名
dnaward([u,u,u],phe).
dnaward([u,u,c],ala).
dnaward([u,u,a],leu).
dnaward([u,u,g],leu).
dnaward([c,u,u],leu).
dnaward([c,u,c],leu).
dnaward([c,u,a],leu).
dnaward([c,u,g],leu).
dnaward([a,u,u],ile).
dnaward([a,u,c],ile).
dnaward([a,u,a],ile).
dnaward([a,u,g],met) :- trans(on).
dnaward([a,u,g],begin).
dnaward([g,u,u],val).
dnaward([g,u,c],val).
dnaward([g,u,a],val).
dnaward([g,u,g],val).
dnaward([u,c,u],ser).
dnaward([u,c,c],ser).
dnaward([u,c,a],ser).
dnaward([u,c,g],ser).
dnaward([c,c,u],pro).
dnaward([c,c,c],pro).
dnaward([c,c,a],pro).
dnaward([c,c,g],pro).
dnaward([a,c,u],thr).
dnaward([a,c,c],thr).
dnaward([a,c,a],thr).
dnaward([a,c,g],thr).
dnaward([g,c,u],ala).
dnaward([g,c,c],ala).
dnaward([g,c,a],ala).
dnaward([g,c,g],ala).
dnaward([u,a,u],tyr).
dnaward([u,a,c],thr).
dnaward([u,a,a],end).
dnaward([u,a,g],end).
dnaward([c,a,u],his).
dnaward([c,a,c],his).
dnaward([c,a,a],gln).
dnaward([c,a,g],gln).
dnaward([a,a,u],asn).
dnaward([a,a,c],asn).
dnaward([a,a,a],lys).
dnaward([a,a,g],lys).
dnaward([g,a,u],asp).
dnaward([g,a,c],asp).
dnaward([g,a,a],glu).
dnaward([g,a,g],glu).
dnaward([u,g,u],cys).
dnaward([u,g,c],cys).
dnaward([u,g,a],end).
dnaward([u,g,g],trp).
dnaward([c,g,u],arg).
dnaward([c,g,c],arg).
dnaward([c,g,a],arg).
dnaward([c,g,g],arg).
dnaward([a,g,u],ser).
dnaward([a,g,c],ser).
dnaward([a,g,a],arg).
dnaward([a,g,g],arg).
dnaward([g,g,u],gly).
dnaward([g,g,c],gly).
dnaward([g,g,a],gly).
dnaward([g,g,g],gly).
%DNA列(1本に分けたもの)をRNA列へ変換、逆変換も可
dna_rna([],[]).
dna_rna([X|Xs],[Z|Zs]) :-
copy_rule(X,Z),
dna_rna(Xs,Zs).
copy_rule(a,u).
copy_rule(t,a).
copy_rule(g,c).
copy_rule(c,g).
%DNA列(1本)からペアのDNA列を生成する。
make_dna_pair([],[]).
make_dna_pair([X|Xs],[Z|Zs]) :-
pair_rule(X,Z),
make_dna_pair(Xs,Zs).
pair_rule(a,t).
pair_rule(t,a).
pair_rule(g,c).
pair_rule(c,g).
%DNA列(2本)をくっつけて1本の二重螺旋にする。
conjugate_dna([],[],[]).
conjugate_dna([X|Xs],[Y|Ys],[[X,Y]|Zs]) :-
conjugate_dna(Xs,Ys,Zs).
%アミノ酸名から二重螺旋のDNA列を生成。
make_dna(X,Z) :-
rna_amino(Z1,X),
dna_rna(X1,Z1),
make_dna_pair(X1,X2),
conjugate_dna(X1,X2,Z).