0
Help us understand the problem. What are the problem?

More than 3 years have passed since last update.

posted at

updated at

Organization

Snakemake:入力ファイルの拡張子の表記ゆれに対応する

概要

snakemakeのワークフローの書き方でちょっとハマったのでメモ。

バイオインフォマティクスで使われている塩基配列データの保存形式に、FASTA形式というものがあります。これを保存するときは拡張子に.fastaを使うことが多いのですが、.faとする場合もあります。

Pythonベースのパイプライン作成ツールsnakemakeのワークフローを書くときに、このような表記ゆれに両方対応させる書き方を以下にメモしておきます。

Snakefileの書き方

bwa index を実行するサンプルです。

以下のように書くと、正規表現でどちらの表記の入力ファイルでも対応できます。

rule sort:
    input:
        "{sample}.{ext,(fasta|fa)}"
    output:
        "{sample}.{ext}.bwt"
    shell:
        "bwa index {input}"

実行

snakemake hoge.fasta.bwt 

or

snakemake hoge.fa.bwt 

追記

こう書いたけど、結局configで渡しちゃったほうが楽な気がする。。

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
0
Help us understand the problem. What are the problem?