6
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

sql oracleAdvent Calendar 2018

Day 5

旅人算メソッドの解説

Last updated at Posted at 2019-01-13

昔、US-OTNに投稿した
Tabibitosan method tutorial by Aketi Jyuuzou
https://community.oracle.com/thread/1007478
を日本語に翻訳しつつ、全面リニューアルしてみました。

#01 旅人算とは?
受験算数で有名な問題の1つです。

英進館CM:「歩く男」YouTube
https://www.youtube.com/watch?v=6I58kZybVUU

旅人算 - 算数の教え上手 | 学びの場.com
https://www.manabinoba.com/math/757.html

Hello School 算数 旅人算
https://www.hello-school.net/sansub1801.html

旅人算―中学入試問題をわかりやすくマンガで攻略
https://www.amazon.co.jp/dp/4895243702

#02 旅人算メソッドとは?
SQLで、何らかの条件で連続した行を、集約したいときに使う、SQLおよび考え方です。
受験算数の旅人算での脳内の旅人のイメージがベースになってます。

#03 数値の連続した行を集約

create table Ex1 (NumVal primary key) as
select  1 from dual union
select  2 from dual union
select  3 from dual union
select  5 from dual union
select  6 from dual union
select  7 from dual union
select 10 from dual union
select 11 from dual union
select 12 from dual union
select 20 from dual union
select 21 from dual;

数値の連続した行を集約します。

select min(NumVal),max(NumVal),count(*)
from (select NumVal,
      NumVal - Row_Number() over(order by NumVal)
      as DisTance
      from Ex1)
group by DisTance
order by min(NumVal);

Min(NumVal)  Max(NumVal)  count(*)
-----------  -----------  --------
          1            3         3
          5            7         3
         10           12         3
         20           21         2

上記のSQLでは、2人の旅人(XとA)をイメージしてます。
旅人Xは、必ず1進みます。 Row_Number() over(order by NumVal)
旅人Aは、必ず1以上進みます。 NumVal

そして、旅人Xと旅人Aとの距離でグループ化してます。group by DisTance

#04 日付の連続した行を集約

create table Ex2 (DateVal primary key) as
select date '2009-12-10' from dual union
select date '2009-12-11' from dual union
select date '2009-12-12' from dual union
select date '2009-12-16' from dual union
select date '2009-12-17' from dual union
select date '2009-12-20' from dual;

select min(DateVal),max(DateVal),count(*)
from (select DateVal,
      DateVal - Row_Number() over(order by DateVal)
      as DisTance
      from Ex2)
group by DisTance
order by min(DateVal);

Min(DateVal)  Max(DateVal)  count(*)
------------  ------------  --------
2009-12-10    2009-12-12           3
2009-12-16    2009-12-17           2
2009-12-20    2009-12-20           1

#05 年月の連続した行を集約

create table Ex3 (DateVal primary key) as
select date '2009-09-01' from dual union
select date '2009-10-01' from dual union
select date '2009-12-01' from dual union
select date '2010-01-01' from dual union
select date '2010-02-01' from dual union
select date '2010-04-01' from dual;

select min(DateVal),max(DateVal),count(*)
from (select DateVal,
       extract(year  from DateVal)*12
      +extract(month from DateVal)
      -Row_Number() over(order by DateVal)
      as DisTance
      from Ex3)
group by DisTance
order by min(DateVal);

min(DateVal)  max(DateVal)  count(*)
------------  ------------  --------
2009-09-01    2009-10-01           2
2009-12-01    2010-02-01           3
2010-04-01    2010-04-01           1

#06 列の値が一致し続ける行を集約

前述した旅人算メソッドは、列の値が、1づつ増える行を集約しました。

旅人算メソッドは、ソートキーの順序で、列の値が一致し続ける行を集約する
という用途もあります。

create table Ex4 (ID,Val,SortKey) as
select 1, 5, 1 from dual union all
select 1,10, 2 from dual union all
select 2, 2, 3 from dual union all
select 2, 5, 4 from dual union all
select 1,15, 5 from dual union all
select 3,25, 6 from dual union all
select 3,10, 7 from dual union all
select 3, 5, 8 from dual union all
select 3,15, 9 from dual union all
select 4, 5,10 from dual;

SortKeyの昇順でIDが一致する行を集約します。

select ID,min(Val),max(Val),count(*)
from (select ID,Val,SortKey,
       Row_Number() over(order by SortKey)
      -Row_Number() over(partition by ID order by SortKey)
      as DisTance
      from Ex4)
group by ID,DisTance
order by min(SortKey);

ID  Min(Val)  Max(Val)  COUNT(*)
--  --------  --------  --------
 1         5        10         2
 2         2         5         2
 1        15        15         1
 3         5        25         4
 4         5         5         1

上記のSQLでは、5人の旅人(XとAとBとCとD)をイメージしてます。
旅人Xは、必ず1進みます。 Row_Number() over(order by NumVal)
旅人Aは、ID = 1 の時のみ、1進みます。Row_Number() over(partition by ID order by SortKey)
旅人Bは、ID = 2 の時のみ、1進みます。Row_Number() over(partition by ID order by SortKey)
旅人Cは、ID = 3 の時のみ、1進みます。Row_Number() over(partition by ID order by SortKey)
旅人Dは、ID = 4 の時のみ、1進みます。Row_Number() over(partition by ID order by SortKey)

そして、
旅人Xと旅人Aとの距離。旅人Xと旅人Bとの距離。
旅人Xと旅人Cとの距離。旅人Xと旅人Dとの距離。
を求めます

そして、旅人の種類(A,B,C,Dのいずれか)と、旅人Xとの距離
でグループ化してます。group by ID,DisTance

#07 複数列の値が一致し続ける行を集約
元ネタ US-OTN analytic sql question
https://community.oracle.com/thread/941878

create table mytable (sortKey,Val1,Val2) as
select 1,'A','X' from dual union all
select 2,'A','X' from dual union all
select 3,'B','Y' from dual union all
select 4,'B','Y' from dual union all
select 5,'A','X' from dual union all
select 5,'B','X' from dual union all
select 6,'A','Y' from dual union all
select 7,'B','Y' from dual union all
select 7,'A','Y' from dual union all
select 8,'A','Y' from dual;

SortKeyの昇順でVal1とVal2が一致する行を集約します。

select Val1,Val2,min(sortKey) as sta,max(sortKey) as end
from (select sortKey,Val1,Val2,
       dense_rank() over(order by sortKey)
      -Row_Number() over(partition by Val1,Val2
                         order by sortKey)
      as DisTance
       from mytable)
group by Val1,Val2,DisTance
order by min(sortKey);

Val1  Val2  sta  end
----  ----  ---  ---
A     X       1    2
B     Y       3    4
B     X       5    5
A     X       5    5
A     Y       6    8
B     Y       7    7

上記のSQLでは、5人の旅人(XとAとBとCとD)をイメージしてます。
旅人Xは、必ず1進みます。 dense_rank() over(order by NumVal)
旅人Aは、Val1 = 'A' and Val2 = 'X' の時のみ、1進みます。 Row_Number() over(partition by Val1,Val2 order by SortKey)
旅人Bは、Val1 = 'A' and Val2 = 'Y' の時のみ、1進みます。 Row_Number() over(partition by Val1,Val2 order by SortKey)
旅人Cは、Val1 = 'B' and Val2 = 'X' の時のみ、1進みます。 Row_Number() over(partition by Val1,Val2 order by SortKey)
旅人Dは、Val1 = 'B' and Val2 = 'Y' の時のみ、1進みます。 Row_Number() over(partition by Val1,Val2 order by SortKey)

そして、
旅人Xと旅人Aとの距離。旅人Xと旅人Bとの距離。
旅人Xと旅人Cとの距離。旅人Xと旅人Dとの距離。
を求めます

そして、旅人の種類(A,B,C,Dのいずれか)と、旅人Xとの距離
でグループ化してます。group by Val1,Val2,disTance

#08 旅人算メソッドと同じ結果を得る方法

旅人算メソッドは、
Lag関数とCase式を組み合わせて、WillSumという値を求めてから、
sum関数で累計を求めるという方法で代用できます。

select min(NumVal),max(NumVal),count(*)
from (select NumVal,
      sum(WillSum) over(order by NumVal) as GID
      from (select NumVal,
            case when NumVal-1
               = Lag(NumVal) over(order by NumVal)
                 then 0 else 1 end as WillSum
            from Ex1))
group by GID
order by GID;

Min(NumVal)  Max(NumVal)   COUNT(*)
-----------  -----------  ---------
          1            3          3
          5            7          3
         10           12          3
         20           21          2

上記のSQLでは、インラインビューが2つ必要ですが、
旅人算メソッドを使えば、インラインビューが1つで済みます。

12cからは、Match_Recognize句を使う方法もあります。
Match_Recognize句を使えば、インラインビューは不要になります。

#09 旅人算メソッドが使用された質問(日本語)
OTN 連続する項目の件数をカウントするには?
https://community.oracle.com/thread/2596029

#10 旅人算メソッドが使用された質問(英語)
sql - Oracle : min max values within a repeating group - Stack Overflow
https://stackoverflow.com/questions/20632922/oracle-min-max-values-within-a-repeating-group

#11 旅人算メソッドを紹介したブログ(日本語)
履歴管理されているマスタを圧縮するSQL - A.R.N [日記]
http://d.hatena.ne.jp/arn/20120823/p1

キー項目がブレイクしたタイミングでサマリ集計するSQL (ROW_NUMBER分析ファンクション)
https://gonsuke777.hatenablog.com/entries/2014/12/02

#12 旅人算メソッドを紹介したブログ(英語)
About Oracle: Tabibitosan
http://rwijk.blogspot.com/2014/01/tabibitosan.html

12c MATCH_RECOGNIZE: Grouping sequences | An Oracle Programmer
https://stewashton.wordpress.com/2014/03/05/12c-match_recognize-grouping-sequences/

6
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
3

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?