Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

This article is a Private article. Only a writer and users who know the URL can access it.
Please change open range to public in publish setting if you want to share this article with other users.

More than 3 years have passed since last update.

Pythonデータ解析お百度参り43:最長共通部分列

Last updated at Posted at 2020-06-24

最長共通部分列問題

2つの列 $X$, $Y$ が以下のように与えられます。

$$X = (x_1, x_2, ..., x_m) $$
$$Y = (y_1, y_2, ..., y_n)$$

与えられた列の集合の最長共通部分列(Longest-common subsequence problem, LCS)を見つける問題を解きます。たとえば pencilpenguin のLCSは peni の4文字です。

列 $X$ の接頭辞(先頭 $i$ 文字までの文字列)を $X_i$、列 $Y$ の接頭辞(先頭 $j$ 文字までの文字列)を $Y_j$ としたとき、 $X_i$ と $Y_j$ のLCSの長さ $LCS (X_i, Y_j)$ は次のように動的計画法で計算できます。

LCS (X_i, Y_j) =  \left\{
\begin{array}{ll}
0 & if \quad i = 0 \quad or \quad j = 0 \\
LCS (X_{i-1}, Y_{j-1}) + 1 & if \quad x_i = y_j \\
max \Bigl(LCS (X_{i}, Y_{j-1}), LCS (X_{i-1}, Y_{j}) \Bigr) & otherwise
\end{array}
\right.

またこの解法は、生命情報学(バイオインフォマティクス)という分野で日常的に用いられる配列相同性検索の基礎となるものです(実際には、文字列同士の類似性を考慮したもっと巧妙な手法を用います)。

課題43:最長共通部分列

長さ $n$ の文字列 $s$ と、長さ $m$ の文字列 $t$ を入力としたとき、その2つの文字列の最長共通部分列の長さを求める関数を作ってください。

ただし、

  • 1 ≤ $n$ ≤ 104
  • 1 ≤ $m$ ≤ 104

とします。

  • 例1
s = "pencil"
t = "penguin"
4
  • 例2
s = "dreamingly"
t = "dreadfully"
6
  • 例3
s = "This is a pen. This is an apple."
t = "pen-pineapple-apple-pen"
10
  • 例4
s = "There is more to life than increasing its speed. "\
      "(by Mahatma Gandhi)"

t = "There is always light behind the clouds. "\
      "(by Louisa May Alcott)"
31
  • 例5
s = "If you want to be successful, it's just this simple: "\
      "Know what you are doing, love what you are doing, "\
      "and believe in what you are doing. "\
      "(by Will Rogers)"

t = "Success is not the key to happiness. "\
      "Happiness is the key to success. "\
      "If you love what you are doing, "\
      "you will be successful. "\
      "(by Louisa May Alcott)"
71

課題提出方法

  • 基本的にGoogle Colaboratoryを用いてプログラミングしてください。どうしても Google Colaboratory を用いることができない場合のみ、Jupyter Notebook または Jupyter Lab を用いてください。

  • 課題1つごとに、ノートブックを新規作成してください。1つのノートブックで複数の課題を解かないでください。

  • ノートブックを新規作成すると「Untitled.ipynb」のような名前になりますが、それを「学籍番号・氏名・課題番号」のような名前に変更してください。

  • 質問・感想・要望などございましたらぜひ書き込んでください。

  • もし課題を解くにあたって参考になったウェブサイトがあれば、それについても触れてください。

  • 課題を計算し終わった ipynb ファイルを提出するときは、指定したメールアドレスに Google Drive で共有する形で授業担当者に提出してください。


0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?