はじめに
機械学習、特にGANの学習においてMNISTデータセットは代表的な教材として使用されています。しかし、MNISTに限らず独自のデータセットで実験したいケースも多いのではないでしょうか。
そこで、p5.jsを使用して簡単にカスタムデータセットを作成できるツールを開発しました。
開発したツールについて
p5-shape-table-generatorは、p5.jsを使用して手軽に機械学習用のデータセットを作成できるWebアプリケーションです。
デモ
以下のURLで実際に試すことができます:
https://koya-kimura.github.io/p5-shape-table-generator/
生成データについて
画像データ
- ランダムな位置に正多角形を生成
- 3〜6角形の自動生成
- 図形のパラメータをCSVファイルに保存
- 生成された図形をPNG形式で保存
- 中心座標の正規化(0-1の範囲)
csvデータ
- CSVデータ(shape_data.csv)
カラム名 | 説明 | 値の範囲 |
---|---|---|
file | 画像ファイル名 | 4桁の連番 |
centerX | X座標(正規化) | 0-1 |
centerY | Y座標(正規化) | 0-1 |
radius | 半径(ピクセル) | 実数 |
vertices | 頂点数 | 3-6 |
angle | 回転角度 | 0-2π |
perimeter | 周の長さ | 実数 |
特徴
- ブラウザ上で直接描画が可能
- MNISTデータセットに近い形式でデータを生成
- p5.jsの描画機能を活用した直感的なインターフェース
使用技術
- p5.js
- HTML5 Canvas
- JavaScript
使い方
- ブラウザでツールにアクセス
- キャンバス上に任意の図形を描画
- データセットとして保存
ソースコード
GitHubでソースコードを公開しています:
https://github.com/koya-kimura/p5-shape-table-generator
おわりに
このツールを使用することで、機械学習の実験用データセットを手軽に作成することができます。MNISTデータセット形式の独自データセットが必要な場合に、ぜひ活用してください。