はじめに
最近、MySQLを使う機会が増えています。
その中でテストデータの生成や、連続する日付生成など連番が欲しくなる場面がちょいちょいありました。
連番はPostgreSQLならばgenerate_series()関数が、OracleならLEVEL疑似列があります。
しかしMySQLにはちょうどいいのがないので、色々工夫する必要がありました。
なので今回はMySQLで連番を生成する"工夫"について、まとめたいと思います。
既存テーブルへの連番追加
例えば次のような果物とその値段が入力されたテーブルがあるとします。
SELECT * FROM sample;
+-----------+-------+
| name | price |
+-----------+-------+
| りんご | 100 |
| みかん | 80 |
| バナナ | 120 |
+-----------+-------+
これを値段の安い順に番号を付け並べるには以下のようにします。
SET @num=0;
SELECT
@num:=@num+1 AS num,
name,
price
FROM sample
ORDER BY price;
+------+-----------+-------+
| num | name | price |
+------+-----------+-------+
| 1 | みかん | 80 |
| 2 | りんご | 100 |
| 3 | バナナ | 120 |
+------+-----------+-------+
「@num」変数を定義することで上述のように簡単に連番を付与できます。
ここで注意することは必ず「SET @num=0;」を忘れないことです。
「@num」変数の変動は継続するため、再び上述のSELECT文を実行すると次のような結果となります。
SELECT
@num:=@num+1 AS num,
name,
price
FROM sample
ORDER BY price;
+------+-----------+-------+
| num | name | price |
+------+-----------+-------+
| 4 | みかん | 80 |
| 5 | りんご | 100 |
| 6 | バナナ | 120 |
+------+-----------+-------+
前回で「@num」が3となったため、さらに増加しています。
そのため「SET @num=0;」による初期化が必要です。
テストデータのための連番生成
DBの連番生成機能のよいところは、テストデータが簡単に生成できることです。
しかしMySQLだと丁度よい関数がないため、工夫が必要です。
単純な方法
先程説明した通り、既存のテーブルには簡単に連番が付与できます。
そのためMySQLがデフォルトで持っており、どのユーザでも簡単にアクセス可能なテーブルがあれば、連番のみのテーブルが作成可能です。
※行数さえ豊富にあれば中身のデータは参照しないので何でもよいです。
多くの方はそんな都合のいいテーブルとして「information_schema.COLUMNS」を使っているようです。
例えば10行の連番を持つテストテーブルを作成するには次のようにします。
SET @num=0;
SELECT
@num:=@num+1 AS num,
MD5(@num) AS txt
FROM information_schema.COLUMNS
LIMIT 10;
+------+----------------------------------+
| num | txt |
+------+----------------------------------+
| 1 | c4ca4238a0b923820dcc509a6f75849b |
| 2 | c81e728d9d4c2f636f067f89cc14862c |
| 3 | eccbc87e4b5ce2fe28308fd9f2a7baf3 |
| 4 | a87ff679a2f3e71d9181a67b7542122c |
| 5 | e4da3b7fbbce2345d7772b0674a318d5 |
| 6 | 1679091c5a880faf6fb5e6087eb1b2dc |
| 7 | 8f14e45fceea167a5a36dedd4bea2543 |
| 8 | c9f0f895fb98ab9159f51fd0297e236d |
| 9 | 45c48cce2e2d7fbdea1afc51c7c6ad26 |
| 10 | d3d9446802a44259755d38e6d163e820 |
+------+----------------------------------+
※MD5関数を使うことで文字列も生成しています。
ただしこの方法で生成できるテーブルの行数は「information_schema.COLUMNS」の行数に依存しています。
これを超えるテストデータ生成には、UNIONを上手く使うか、自前で行数が非常に大きいテーブルを作る必要があります。
プログラムを使った方法
UNIONでテーブルを連結することで、次のように任意の行数のテーブルが生成可能です。
ただし手動でこれを何千行分も生成するのは現実的ではありません。
MySQLへ何かしらのプログラミング言語で接続してループ処理するのが簡単です。
今回はmysql-connector-pythonを用いてpythonから接続して試してみます。
# coding:utf-8
import mysql.connector
# 接続情報辞書
config = {
'user': 'root',
'password': 'password',
'host': '123.45.67.890',
'database': 'test'
}
# 接続
conn = mysql.connector.connect(**config)
# ------------------------------
# テストデータSELECT文生成
# ------------------------------
start_num = 0
end_num = 10
query_list = ["(SELECT {start_num} AS s".format(start_num=start_num)]
# 「UNION ALL SELECT {num}」を追加
for i in range(start_num + 1, end_num):
query_list.append(" UNION ALL SELECT {num}".format(num=i))
query_list.append(")")
query = "\n".join(query_list)
# ------------------------------
# SELECT文の実行
cursor = conn.cursor()
cursor.execute(query)
# SELECT結果の取得
for get_row in cursor:
print(get_row[0])
# 接続終了
conn.close()
結果、以下のようなSELECT文が生成され、連番を持ったテーブルが取得できます。
(SELECT 0 AS s
UNION ALL SELECT 1
UNION ALL SELECT 2
UNION ALL SELECT 3
UNION ALL SELECT 4
UNION ALL SELECT 5
UNION ALL SELECT 6
UNION ALL SELECT 7
UNION ALL SELECT 8
UNION ALL SELECT 9
)
連番の参照は、次のように連番箇所を副問合せにすることで可能です。
# coding:utf-8
import mysql.connector
# 接続情報辞書
config = {
'user': 'root',
'password': 'password',
'host': '123.45.67.890',
'database': 'test'
}
# 接続
conn = mysql.connector.connect(**config)
# ------------------------------
# テストデータSELECT文生成
# ------------------------------
start_num = 0
end_num = 10
query_list = ["SELECT serial_num.s, md5(serial_num.s) FROM", "(SELECT {start_num} AS s".format(start_num=start_num)]
# 「UNION ALL SELECT {num}」を追加
for i in range(start_num + 1, end_num):
query_list.append(" UNION ALL SELECT {num}".format(num=i))
query_list.append(") AS serial_num")
query = "\n".join(query_list)
# ------------------------------
# SELECT文の実行
cursor = conn.cursor()
cursor.execute(query)
# SELECT結果の取得
for get_row in cursor:
print(get_row[0], get_row[1])
# 接続終了
conn.close()
0 cfcd208495d565ef66e7dff9f98764da
1 c4ca4238a0b923820dcc509a6f75849b
2 c81e728d9d4c2f636f067f89cc14862c
3 eccbc87e4b5ce2fe28308fd9f2a7baf3
4 a87ff679a2f3e71d9181a67b7542122c
5 e4da3b7fbbce2345d7772b0674a318d5
6 1679091c5a880faf6fb5e6087eb1b2dc
7 8f14e45fceea167a5a36dedd4bea2543
8 c9f0f895fb98ab9159f51fd0297e236d
9 45c48cce2e2d7fbdea1afc51c7c6ad26
SELECT serial_num.s, md5(serial_num.s) FROM
(SELECT 0 AS s
UNION ALL SELECT 1
UNION ALL SELECT 2
UNION ALL SELECT 3
UNION ALL SELECT 4
UNION ALL SELECT 5
UNION ALL SELECT 6
UNION ALL SELECT 7
UNION ALL SELECT 8
UNION ALL SELECT 9
) AS serial_num
テストデータ生成用のプロシージャを作成する
プログラムを使わずとも、プロシージャを使えばMySQLだけで巨大なテーブルを生成可能です。
以下は、引数に渡した数字行のgenerate_series_tblテーブルを生成するプロシージャです。
先頭でDROP TABLEをしているため、実行するたびに新しくテーブルが生成されます。
DELIMITER //
CREATE PROCEDURE generate_series (IN max INT)
BEGIN
DECLARE i INT;
SET i = 0;
DROP TABLE IF EXISTS generate_series_tbl;
CREATE TABLE generate_series_tbl (num INT);
WHILE i < max DO
INSERT INTO generate_series_tbl VALUES (i);
SET i = i + 1;
END WHILE;
END
//
DELIMITER ;
CALL generate_series(100);
Query OK, 1 row affected (1.61 sec)
SELECT count(*) FROM generate_series_tbl;
+----------+
| count(*) |
+----------+
| 100 |
+----------+
SELECT * FROM generate_series_tbl;
+------+
| num |
+------+
| 0 |
| 1 |
| 2 |
| 3 |
…(中略)…
| 97 |
| 98 |
| 99 |
+------+
上記の通り、0~99までの連番を持つテーブルが生成されました。
当然、実データをINSERTしているため、テーブルが巨大になるほど生成に時間がかかります。
またその巨大テーブルを放置することとなるため、一時テーブルとして生成するのもよいかもしれません。
参考リンク
連番生成について
-
MySQLで連番の仮想表を作る
https://blog.toshimaru.net/mysql-virtual-table/
通常の連番生成や、値を倍加させる方法など基本から応用まで丁寧にまとめてあります。
本記事作成において、こちらのサイトを大変参考にさせていただきました。 -
裏MySQLクエリー入門(15) 応用編3 MySQLで連番の仮想表を作成
https://it7c.hatenadiary.org/entry/20100713/1278950305
PHPによる連番生成方法が紹介されています。
プログラムによる連番生成の参考にさせていただきました。
mysql-connector-pythonについて
-
MySQL Connector / Python開発者ガイド
https://dev.mysql.com/doc/connector-python/en/preface.html
mysql-connector-pythonの公式マニュアルです。
オプションや詳細な機能について調べたいときは必須です。 -
Python 3 から MySQL を触る
https://qiita.com/hoto17296/items/0cfe7cdd3c47b69cc892
mysql-connector-python(※正確にはそれより古いmysql-connector-python-rf)の基本的な使い方が日本語で説明されています。
プロシージャについて
-
ストアドプロシージャの基本的ななにか
https://qiita.com/setsuna82001/items/e742338eb93e3a48ba46
MySQLのストアドプロシージャ生成の仕方の基礎から応用まで丁寧に解説されています。