起こったこと
メモリー積み積みマシーンでメモリー不足エラーでファイルが開けないだと????
はじめに
DNAやRNAなどの核酸配列を読むマスィーンをシークエンサーを呼ぶ。
この内、10年以上前に実用化された、これまでのサンガーシークエンスなどでは
実現できなかった大量の配列を一気に読めるようになったシークエンサーを次世代シークエンさー、NGSと呼ぶ。
いつまで次世代やってんのというのはあるが、とりあえずNGSと呼ぶのさ。
で、NGSで吐き出された各種の配列情報は、アレヤコレヤの処理を経て、
例えば変異のリストや、例えば遺伝子産物の多寡のリストになっていく。
この中でよく出てくる中間ファイルにbamがある。
これは各種の配列情報に、然るべきアルゴリズムで位置情報を付与した後、
読み込み側道向上のためにバイナリ化したものである。
詳しくはこの辺を読もう。
http://array.cell-innovator.com/?p=3014
で、特定の遺伝子の、この領域について、アライメント、つまりそれぞれのリードに付与された位置情報を
視覚的に確認したいときには、それ用のビューワーが必要で、
その代表がigvである。
開発はおなじみの神様仏様Broad様である。
で、ゲノム上の遺伝子の位置情報なんかを見るだけなら大したメモリー消費はしないんだけど、
例えば数十Gを超える巨大なBam(全エクソンや全ゲノムとかになるとこのレベル)を開こうとすると、メモリー不足で突然落ちたりする。
せめてエラーメッセージを吐けと思うんだけど、突然落ちる。
で、igvはjavaでうごいているので、物理メモリに余裕があるようであれば起動オプションの指定でなんとかなる。
解決策
igvの起動アイコンは、batファイルへのショートカットなのでここからbatファイルに至り、
javaの起動オプションを変更することで、一応メモリー不足問題に対応可能である。
起動アイコン
起動アイコンのフォルダが開かれる。
アイコンを右クリック→プロパティ
本命batファイルの場所が記載されている。
ワイの場合は
C:\Program Files\IGV_2.8.2\igv-launcher.bat
だった。バージョンが多少違うかもだが、他は大体同じじゃないかな?
適当なテキストエディタでそのファイルを開くと以下のような記載が。
このうち、下の赤四角が最大メモリーのオプションである。
あくまで設定の問題の場合。本格的にメモリー足りない場合はこれでは解決しない。
メモリーを足すか、たくさん積んだマシーンを使うかしよう。