概要
以前、YOLOと将棋エンジンを用いて詰み筋を探索するアプリケーション「詰将棋敗北者Web」を開発しました。
この記事では、その開発秘話として、取り組みを通じて得た知見や気づきを共有します。アプリ自体の詳細な解説は以下の記事にまとめているので、よろしければご覧ください。
詰将棋敗北者Webとは?
スマホアプリで詰将棋を解いていると、どうしても解けない局面に出くわすことがあります。特に解答がアプリに付いていないと、「なんで解けないんだ…」と、まるで敗北者になったような気持ちになることもあります😇
そんな悔しさを解消するために作ったのが「詰将棋敗北者Web」です。将棋アプリの画面をスクショしてアップロードするだけで、詰将棋の解答が確認できます。
技術的には、YOLOという深層学習モデルを使って将棋のコマを検出し、その局面をやねうら王詰将棋エンジンに入力して詰み筋を探索しています。
得られた知見・気づき
機械学習のプロじゃなくても、動くものが作れた!
私は、業務で機械学習を触ったことがありませんが、
クラウド機械学習サービスUltralytics HUBで画面をポチポチすることによって、(精度は一旦置いておいて)将棋のコマを検出する機械学習モデルを作成することに成功しました。
数年前に比べると、
このようなノーコードで機械学習ツールが増えてきている印象がありまして、
機械学習の素人でもモデルが作れてしまうという所感です。
プロトタイプ制作
当アプリの制作過程では、まず、YOLOで自分が思うような物体検出が可能かどうかを調べるためにRoboflowというクラウドサービスで学習モデルのプロトタイプを制作してみました。1
このサービスのUI/UXがかなり良くて、なんと、データのラベリングやデータの前処理も含めて、ノーコードで学習モデルを開発することができます!
以下の画像のように、Web上で画像にラベルを貼って学習データを作ることもできますし、
前処理やデータ拡張(Data Augmentation)が可能です。
前処理(リサイズとグレースケールを指定):
データ拡張(90度横に倒した画像とノイズの入った画像を生成):
理解に時間がかかる
理解を重視するマインドセット
新しい技術や仕組みを触る際には、理解に時間がかかることを前提にしたマインドセットが重要だと強く感じました。特に、深層学習モデルの利用やクラウドサービスの組み合わせなど、自分にとって新しい分野に取り組むときには、最初に必要な学習コストを無視しないことが成功への鍵だと考えています。
たとえば、YOLOや将棋エンジンを実際に組み込む際、最初に公式ドキュメントやREADMEを読んだときは全体像を理解するのにやや苦戦しました。特にAPIの仕様やデータフォーマットの詳細について、以下のようなことに時間を費やしました:
-
【公式ドキュメントの理解と実装への適用】
公式ドキュメントは網羅的ですが、全体を読むだけでは実際に動くものを作るための具体的な道筋が見えないことがありました。そのため、まず小さな実験を繰り返しながら「動かして理解する」というアプローチを採用しました。 -
【関連技術の学び直し】
YOLOの基本的な物体検出の仕組みや、将棋の局面データの表現形式を理解するのに、時間をかけて基礎的なリソースを調べ直しました。具体的には、各種公式ドキュメントやブログ記事、Githubのサンプルコードを参考にして概念を分解して整理しました。 -
【予測不能なエラー対応】
特に新しい技術を使うときには、ドキュメントに書かれていないエラーや設定の問題に直面することがあります。
私の場合、YOLOの学習データをクラウドにアップロードする際にデータフォーマットの不一致で詰まることがありました。
理解を軽視すると「時間を溶かす」原因に
新しい技術に取り組む際、理解を軽視したアプローチが結果として時間を無駄にする原因になることがあります。その典型的な例が、問題が発生した際に原因を深く探らずに、片っ端から解決策を試す方法です。
これは私自身が、納期が迫っているときなどに、ついついやってしまうのですが、
当てずっぽうなアプローチなので時間を溶かすことが多いです。
当アプリの製作過程では、フロントエンド実装でこれを痛感しました。
今回初めてReactを触りましたが、refについて誤解をしており時間を溶かしたことがありました。
業務で新しいフレームワークを触る時は、本を1冊買ってまる読みしておくようにしていますが、
個人開発だと責任感がないので、Reactの公式ドキュメントに雑に目を通して、終わりにしてしまっていました。。
後学のためにも時間をかけてReactについて調べておくべきでした。
参考: マイクロソフト流「生産性爆上げ、6つの鉄則」
動画内では、マイクロソフトのエンジニアが理解にどのように時間を掛けているか解説されています。 特に、マイクロソフトのエンジニアであっても理解には時間がかかるという話が非常に参考になりました。
個人開発のモチベ
当アプリの開発では、「自分が使いたいサービスを作る」という動機が、開発を続ける上での大きな支えになりました。
「詰将棋敗北者Web」も、自分にとって便利なツールを作りたいという思いがあったため、途中で技術的に詰まる場面があっても手を止めずに進めることができました。
反省点: コードの保守性
フロントエンドでは、JavaScriptで一部の将棋のロジックを実装しました。
アドベントカレンダーの公開日に合わせるために、JavaScriptを書き殴ることによって、完成させましたが、結果として、デバッグやメンテナンスが大変になり、「汚いコードはモチベを下げる」 ことを痛感しました。
将棋ぐらいの複雑さがある場合は、保守性は必要でしたね。。
おわりに
「詰将棋敗北者Web」の開発を通じて、技術的な課題に向き合いながらも、自分が使いたいと思えるサービスを形にする楽しさを感じました。また、未知の技術やエラーに直面した際に理解を深めて乗り越える経験は、エンジニアとして再認識しました。
最後までお読みいただき、ありがとうございました。
-
料金の関係で、Roboflowで最後まで学習モデルを作成せずに、途中でUltralytics HUBに切り替えました。 ↩