はじめに
Axrossを運営している藤原です。
Axross とは、エンジニアの"教育"と"実務"のギャップに着目し、「学んだが活用できない人を減らしたい」という想いのもと、ソフトバンクと社内起業制度にて立ち上げたサービスです。
現役エンジニアによる実践ノウハウを"レシピ"として教材化し、実際にプログラミングで実装を追体験しながら学ぶことができます。AI/機械学習をテーマにした、様々な業務領域やビジネスの課題解決に応用できる実践的な学習教材を170以上揃えています。(2021年8月時点)
Axross:https://axross-recipe.com
公式Twitter:https://twitter.com/Axross_SBiv
今回は、深層学習に適したPythonライブラリPyTorchの特徴を紹介し、Axrossのサービスで学べるTensorFlowを活用した実践的なレシピを一部ご紹介します。
TensorFlowとは
**TensorFlow(テンソルフロー)**は、2015年にGoogleのディープラーニング研究プロジェクトが開発し、2017年にオープンソースとしてGithub上で公開された機械学習用のライブラリです。
TensorFlowはGoogle Brain Teamが、人間の脳の動き(学習や論理思考)を模倣したニューラルネットワークを構築することを目指し研究・開発しました。元々はGoogle内部利用を目的に開発されたもので、GoogleやDeepMindの各種サービス(例えば、Google Assistant, Google Photos, Gmail, Google Searchなど)に搭載され、画像処理や自然言語処理、音声翻訳など幅広い分野で活用されています。WindowsOSやMacOS、Android等に対応し、Python、C、Go、Javaなど様々なプログラミング言語用インターフェースも用意されており、Googleの最先端かつ高精度の機械学習関連の機能を無償で、自社の製品・サービスに組み込むことができるため、現在最も利用者の多い機械学習用のライブラリとなっています。
TensorFlowは、Pythonで書かれたオープンソースライブラリKerasによって簡単に実装・運用できるため、ビジネス・商用利用でも使われやすい特性があります。
「Tensor」とは、数学用語で多次元配列を用いて表現できるデータ構造のことを意味し、TensorFlowは名の通り、様々なタスクに対して、n次元配列のデータフローを流しこみ、高速に数学的な処理を行うプログラムを作成するためのフレームワークです。
公式ページ: https://www.tensorflow.org/
Githubリポジトリ:https://github.com/tensorflow/tensorflow
TensorFlowを活用したレシピの紹介
画像認識による乗り物を分類するレシピ(モデル作成編)
投稿者:@uehara7 さん
外部APIを用いてWEBサービスから画像データを収集し、データの前処理、VGG16モデルの構築・評価まで、機械学習(AI)を活用して画像に映る物体を認識して画像分類する、一連のAI開発手法を学ぶことができます。
また、続編の**乗り物画像分類モデルの精度向上レシピ(転移学習編)**では、転移学習によって、画像分類モデルの精度を向上させる手法を学ぶことができます。
YOLOv2とVGG16による料理認識レシピ
投稿者:@belltree さん
深層学習モデル YOLOv2とVGG16による物体検出の学習方法を応用し、料理の画像データを用いて、料理メニューの推定を行います。
labelImgによるアノテーション作成、darkflowでYOLOv2の重みを利用、darkflowからの検出物体データの取り出し方、VGG16のFine TuningとOpenCV/PILの利用法、OpenCVで日本語テキストを表示する方法、交差検証といった、物体検出を行う機械学習モデルを構築するための一連の手法を学ぶことができます。
生産ラインを想定した画像異常検知の実践レシピ
投稿者:@apple さん
オートエンコーダ、畳み込みオートエンコーダ、サーポートベクトルマシン(SVM)を構築し、一様なパターンを持つ画像の異常を検知し、異常部分をマーキングする手法について、画像データの前処理からモデル構築、評価まで機械学習の画像処理タスクの一連の流れを体験できます。
実務では、工場の生産ラインなどで画像をもとに正常の範囲を逸脱するもの(不良品や不純物等)の検出を自動化するときに活用されています。
Arcfaceを用いた類似顔画像検索アプリケーションの実装レシピ
投稿者:@sbtoukouさん
顔認識AIにおける最近のトレンド**深層距離学習(Deep Metric Learning)**モデルの、 Arkfaceを用いて顔画像の類似度を算出し、類似顔画像を検索するアプリケーションを作成します。
このレシピを通して、顔領域の検出から顔領域の補正、特徴抽出、最終的な類似度算出、可視化による定性的な評価を行うまでの処理フローを一通り実装します。最新の顔認識AI処理の流れや実装コードについて理解を深めることができます。
顔交換(FaceSwap)技術を活用し、人物画像の顔を入れ替えるレシピ
投稿者:@katkazzzzzさん
FaceSwapを活用し、動画や画像から人物の顔の入れ替えを行い、機械学習で自然な合成を実現する手法を学びながら、画像処理におけるオートエンコーダーの仕組みとその効果を体験することができます。
AIを利用して人の顔を差し替えるディープフェイクと呼ばれる、フェイク動画の悪用やいたずらが近年問題視されていますが、その技術そのものは非常に優れた技術であり、使い方によっては私たちの社会に貢献できるものと思います。倫理規定に賛同した上でお試しください。
MediaPipeを利用して簡単なジェスチャーを推定するレシピ
投稿者:@KzhtTkhsさん
MediaPipeを用いて手のランドマークを検出し、ランドマークを元に簡単なジェスチャー認識を行う方法をPythonを使って学べるレシピです。
非接触操作システムでの活用例を参考にして、人差指の指先の軌跡から「静止」「時計回り」「反時計回り」の3種類のジェスチャーを認識するプログラムを作ります。ジェスチャー学習用データの取得から、ジェスチャー分類モデルの定義、作成、動作確認までの一連の開発を行います。
TensorFlow Kerasで時系列データの異常検知を行うレシピ
投稿者:@KzhtTkhsさん
TensorFlow Kerasを用いて再構成畳み込みオートエンコーダモデルを構築し、心電図の時系列データに対する波形の異常検知を行う手法と、Optunaを用いたモデル構造探索について学べます。
実運用では、センサーから取得した時系列データを取得・分析し、その特徴を観察することで、モーターの故障を未然に防ぐための異常振動検知など、製造業を中心とした機械のメンテナス業務に応用可能です。
また、@KzhtTkhsさん執筆のTensorFlowを活用した実践的なレシピは他にも、TensorflowのObject Detection APIで道路標識検出モデルを訓練するレシピや、Raspberry piでリアルタイムにディスプレイを読み取るレシピ、**Unityで靴の3D物体検出を行うレシピ**などあります。どれも専門的かつ丁寧なコード解説付きのため、是非併せてご活用ください。
最後に
今回は、AxrossのTensorFlowを使って学べる実践レシピ をご紹介しました。
AIを活用できる人材になるためのコツは、座学勉強よりも、まず実際にAIを実装する体験をしてみる、そして、様々なテーマやデータセットで、異なるAIモデルの実装を繰り返し演習することが近道だと思います。
Axrossのレシピを通して、プログラムの意味を考えながら写経(コードを実際に書き写す行為)し、実際に動くものをつくりながら学ぶことで、新たな知識の習得やスキルアップの一助になれれば幸いです。
また、Axrossでは自身のナレッジを学習教材"レシピ"として寄稿いただけるエンジニアの方も募集しています!