5.4の記事ばっかり書いてるけどLTSの5.5で書きたいのが本音。
前提
- Laravel 5.4
- PHP7.1
- DBはUTF-8(MySQLならutf8mb4 + mysqlnd とする)
解決したいこと
- Databaseから1000万行あるデータとかをCSVとして出力したい
(普通に全件出力するとメモリオーバーする) - CSVはWindows Excel で文字化けせずに開きたい
- レスポンスするファイル名が日本語だった場合の問題は今回は無視
解決方法
- SQLのカーソルを開き、適当なレコード数毎に出力
- Symfony の
StreamedResponse
を使う
全部取ってきて~ってやるとPHPのメモリにどかっと結果セットが乗ってしまうので、RDBのカーソル開いて1行ごとに出力を行う。
レスポンスの作成
StreamedResponse
のコールバック関数を定義する。
Laravelって書いたけど、どっちかというとSymfonyだなこりゃ。
- 出力先を標準出力にして SPLファイルオブジェクトを作成
- UTF-8でもWindows Excelでも文字化けしないようにするため、BOMを書き込む(小ネタ)
- ヘッダ行書き込み
- CSVを1行ごとに出力
<?php
function makeDownloadResponse(array $header, string $filename)
{
$response = new \Symfony\Component\HttpFoundation\StreamedResponse;();
$response->setCallback(function () use ($header) {
$file = new \SplFileObject('php://output', 'w');
// BOMを書き込み
$file->fwrite(pack('C*',0xEF,0xBB,0xBF));
$file->fputcsv(array_values($header));
flush();
// カーソルをOpenにして1行読み込んでCSV書き込み
// RDB毎にやり方違う(後述)
while($row = $pdo->fetch()) {
$file->fputcsv($row);
flush();
}
});
$response->headers->set('Content-Type', 'application/octet-stream');
$response->headers->set('Content-Disposition', 'attachment; filename=' . $filename);
return $response;
}
カーソル開いて~はRDB毎にやり方違うので後述。注意点としてはカーソル開いてると別のクエリ投げれない。
MySQL でカーソル
ここ に書いてるとおり、デフォルトではバッファクエリモードで動いてる。バッファクエリモードは(mysqlndなら)クエリ投げた時点でPHP側にどっさりメモリ乗っかるので非バッファクエリモードにしてやる必要がある。
※追記
後から知ったのだが、LaravelのEloquentには標準でカーソル使ったり、複数回に分けてクエリ投げたりする方法があるのでそちらを使ったほうがよい。
以下古い記事なので参考程度に。
ってなわけでこんな感じ。
<?php
function makeDownloadResponse(array $header, string $filename)
{
$response = new \Symfony\Component\HttpFoundation\StreamedResponse;();
$response->setCallback(function () use ($header) {
$file = new \SplFileObject('php://output', 'w');
// BOMを書き込み
$file->fwrite(pack('C*',0xEF,0xBB,0xBF));
$file->fputcsv(array_values($header));
flush();
// カーソルをOpenにして1行読み込んでCSV書き込み
$pdo = new \PDO('mysql:host=localhost;dbname=dbname', 'user', 'pass');
$pdo->setAttribute(\PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
$stmt = $pdo->prepare('SELECT * FROM hoge_table');
$statement->setFetchMode(\PDO::FETCH_ASSOC);
$stmt->execute();
while($row = $stmt->fetch() ) {
$file->fputcsv($row);
flush();
}
});
$response->headers->set('Content-Type', 'application/octet-stream');
$response->headers->set('Content-Disposition', 'attachment; filename=' . $filename);
return $response;
}
PostgreSQL でカーソル
Postgres はバッファクエリの文献が見つけれなかった/(^o^)\
とりあえずこんな感じ。
<?php
function makeDownloadResponse(array $header, string $filename)
{
$response = new \Symfony\Component\HttpFoundation\StreamedResponse;();
$response->setCallback(function () use ($header) {
$file = new \SplFileObject('php://output', 'w');
// BOMを書き込み
$file->fwrite(pack('C*',0xEF,0xBB,0xBF));
$file->fputcsv(array_values($header));
flush();
// カーソルをOpenにして1行読み込んでCSV書き込み
$pdo = new \PDO('pgsql:host=localhost;dbname=dbname', 'user', 'pass');
$pdo->beginTransaction();
$stmt = $pdo->prepare('DECLARE cursor_hoge CURSOR FOR SELECT * FROM hoge_table');
$stmt->execute();
$statement = $pdo->prepare('FETCH 1 FROM cursor_hoge');
$statement->setFetchMode(\PDO::FETCH_ASSOC);
while($statement->execute() && $row = $statement->fetch()) {
$file->fputcsv($row);
flush();
}
$pdo->rollBack();
});
$response->headers->set('Content-Type', 'application/octet-stream');
$response->headers->set('Content-Disposition', 'attachment; filename=' . $filename);
return $response;
}
カーソル使うのにbeginしてやる必要があるのが注意点。
今回実装したコード
ようやくLaravelらしくなった(気がする)。
Laravelのクエリビルダー使ってるので、インターフェイスとしては何も考えずそいつ渡したらレスポンス返せるようにしたい。今回使ってるRDBMSはPostgresでし。
<?php
namespace App\Contracts;
use Illuminate\Database\Eloquent\Builder;
use Symfony\Component\HttpFoundation\StreamedResponse;
class EloquentCsvBridge
{
const FETCH_COUNT = 100;
const CURSOR_NAME = 'csv_exporting_cursor';
protected $builder;
protected $header;
protected $callbackRowFormat = null;
public function __construct(Builder $builder, array $header, callable $callbackRowFormat = null)
{
$this->builder = $builder;
$this->header = $header;
$this->callbackRowFormat = $callbackRowFormat;
}
protected function getRowsetGenerator(): \Generator
{
$pdo = \DB::connection()->getPdo();
$pdo->beginTransaction();
$sql = $this->builder->toSql();
$statement = $pdo->prepare(sprintf('DECLARE %s SCROLL CURSOR WITH HOLD FOR %s', self::CURSOR_NAME, $sql));
$statement->execute($this->builder->getBindings());
$statement = $pdo->prepare(sprintf('FETCH FORWARD %d FROM %s', self::FETCH_COUNT, self::CURSOR_NAME));
$statement->setFetchMode(\PDO::FETCH_ASSOC);
while (true) {
$statement->execute();
$row = $statement->fetch();
if (empty($row)) {
$pdo->rollBack();
return;
}
yield $row;
while ($row = $statement->fetch()) {
yield $row;
}
}
}
protected function putCsv(\SplFileObject $file, array $row): void
{
// 多重配列の場合ネストをループ
if (is_array(current($row))) {
foreach ($row as $r) {
$this->putCsv($file, $r);
}
return;
}
$cols = [];
foreach ($this->header as $key => $dummy) {
$cols[$key] = $row[$key] ?? "";
}
$file->fputcsv($cols);
return;
}
public function makeDownloadResponse(string $filename)
{
$response = new StreamedResponse();
$response->setCallback(function () {
$file = new \SplFileObject('php://output', 'w');
// BOMを書き込み
$file->fwrite(pack('C*',0xEF,0xBB,0xBF));
$file->fputcsv(array_values($this->header));
flush();
foreach ($this->getRowsetGenerator() as $row) {
if (! is_null($this->callbackRowFormat)) {
$row = ($this->callbackRowFormat)($row);
}
$this->putCsv($file, $row);
flush();
}
});
$response->headers->set('Content-Type', 'application/octet-stream');
$response->headers->set('Content-Disposition', 'attachment; filename=' . $filename);
return $response;
}
}
- 1回あたりのカーソルの進む度合い設定した(今回は100)
- foreach で回したいので行取得部分を Generator 使うようにした
- DBのコネクション取ってるところがなんかダサい
- DB1行で複数返したい場合があったので
putCsv()
を再帰的に処理してる
使い方
<?php
// ~略~
class HogeController
{
public function index()
{
$builder = (new HogeModel())->newQuery();
// $builder->join() ...etc
$bridge = new EloquentCsvBridge($builder, [
'id' => 'ID',
'name' => '名前',
'created_at' => '作成日'
], function ($row){
// 行の整形したりとか
$row['created_at'] = $row['created_at'] ? Carbon::create($row['created_at'])->format('Y-m-d') : "";
return $row;
});
return $bridge->makeDownloadResponse('test.csv');
}
}
$builder がIlluminate\Database\Eloquent\Builder
インスタンスなんだけど、
Illuminate\Database\Eloquent\Query\Builder
もあって、
MIXINされてるからどっちでもいいようにタイプヒンティング使わない方がいいかもしれない。
第二引数はCSVのヘッダ行+キーで行をフィルタするようにしてる。
所感
書いてる人はMySQLおじさんなので?Postgresの文献見つけれなくて苦労した(見つかったとは言ってない)。
省略してるけどphpDocumentorちゃんと書こうね。