CRISPRの論文をみているとsgRNAの選定基準として活性予測スコアやらオフターゲットスコアやらがでてくることがあります。こうしたものは原著論文をたどると機械学習アルゴリズムを利用していたりするため気軽に計算できるというものではありません。
実際に自分のsgRNA配列でだす場合はCRISPORというウェブサイトが便利です。このサイトは与えられた配列情報からsgRNAサイトを網羅的に見つけ出し、一括で種々のオンターゲット・オフターゲットスコアを算出してくれるものとなっています。
最初の画面にあるSequence nameの項目はoptionalと書いてありますが、私の環境では入力しないとエラーになります。
このウェブサイトは単純なスコアだけでなく、実際のオフターゲットサイトの配列やらクローニングのためのプライマー、さらにはNGS解析時の解析コマンドまで提示してくれるかなり包括的なツールになっています。そのためsgRNA設計の際には第一選択として利用する価値は十分あると思います。
ただ一つ注意して頂きたいのは、こうしたスコアが高いからといって必ずしもその通りの結果になるわけではないという点です。特にオンターゲットスコアに関しては、「数十、数百のスケールで行うと過半数は合ってる」という感じの「統計的な正しさ」でしかありません。逆に「このsgRNA配列はオンターゲットスコアが低いから絶対ダメ」と考えなくてもよいと思います。
以上です。ありがとうございました。