JavaScriptのみでAzure Face APIを実行する

Last updated at 2020-07-25Posted at 2020-07-25

TL;DR

文末のソースコードを見てね！

やりたいこと

JavaScriptを使いローカルの画像ファイルをブラウザに読み込み、サーバにアップロードせずAzure Face APIにかける。

解説

ほぼほぼ最小構成にするため、画面のレイアウトとかは考えていません。

index.htmlの一部

<body>
  <div id="output"></div>
  <div id="img"></div>
</body>

ファイルをドラッグ&ドロップでブラウザに読み込みます。formを使ってもよいのですが、ドラッグ&ドロップでやりたい気分だったので。

詳しい解説はソースコードのコメントを参照。バリバリコメントを書いておきます。

javascript　ドラッグ&ドロップ部分

/**
 * ドロップイベント発火時に動く関数
 * 画像ファイルがドロップされたら1枚だけブラウザに読み込む
 * @param {event} e - イベントで取得した内容
 */
function handleDropAction(e) {
  // ブラウザデフォルトのイベント処理を停止
  e.preventDefault();
  e.stopPropagation();

  // ドラッグ&ドロップでブラウザに渡した画像の取得
  const droppedFiles = e.dataTransfer.files;

  // ファイルが1つ以上あれば処理開始
  if (droppedFiles.length > 0) {
    const ajaxData = new FormData();
    const file = droppedFiles[0];    // 1つ目のファイルだけ使う。あとは無視

    // 指定のファイルタイプ（画像）以外の場合はアラートを出して処理を中断
    const permitType = ["image/jpeg", "image/png", "image/gif"];
    if (file && permitType.indexOf(file.type) === -1) {
        alert("この形式のファイルはアップロードできません");
        return;
    }

    /*
     * ファイルのアップロード
     */
    ajaxData.append("file", file);  // アップロードデータを準備

    // 今開いているページにドラッグ&ドロップしたファイルを POST する 
    fetch("index.html", {
      "method": "POST",
      "body": ajaxData
    })
    .then(result => {
      // POST されたファイルを読み込み
      const fr = new FileReader();
      fr.onload = () => {
        // 読み込みが完了したとき

        // 読み込んだ画像をimgタグにしてブラウザのid=imgのdivタグ内に追加
        const image = new Image();
        image.src = fr.result;
        document.getElementById("img").append(image);

        // 顔認識 API 呼び出し
        // 読み込んだファイルのDataURLを渡している
        processImage(fr.result);
      };
      // DataURL形式でドラッグ&ドロップファイルされたファイルを読み込む
      fr.readAsDataURL(file);
    })
    .catch(err => {
      // ファイルの読み込みに失敗したとき
      console.log(err);  // エラー内容をコンソールに出力
    });
  }
}

// id=imgのdevタグにドロップイベント発生時に呼び出される関数をセット
const dropArea = document.getElementById("img");
dropArea.addEventListener("drop", handleDropAction);

javascript　API呼び出し部分

/**
 * 顔認識APIにドラッグ&ドロップした画像を投げる
 * @param {string} dataUrl - ドラッグ&ドロップしたファイルを表す DataURL
 */
function processImage(dataUrl) {
  // APIキーとエンドポイントはAzureポータルで自分で発行したものを使ってね
  const subscriptionKey = "<Subscription Key>";
  const uriBase = "https://<My Endpoint String>.com/face/v1.0/detect";

  // APIの引数をGETパラメータで渡す
  // とりあえずアリアリで
  const params = 
      "returnFaceId=true" +
      "&returnFaceLandmarks=false"+
      "&returnFaceAttributes=" +
          "age,gender,headPose,smile,facialHair,glasses,emotion," +
          "hair,makeup,occlusion,accessories,blur,exposure,noise";

  // DataURL形式の画像データをバイナリを扱えるデータ形式blobに変換する
  // この辺はコピペなので詳しくは調べてね
  const type = dataUrl.slice(5,dataUrl.indexOf(";"));  // DataURLからファイルタイプを取得
  const bin = atob(dataUrl.split(',')[1]);
  const buffer = new Uint8Array(bin.length);
  for (var i = 0; i < bin.length; i++) {
      buffer[i] = bin.charCodeAt(i);
  }
  const blob = new Blob([buffer.buffer], { type: type });

  /*
   * ドラッグ&ドロップした画像とAPIパラメータでFace APIを呼び出す
   */
  // バイナリデータなのでoctet-streamで。
  // APIキーは添えるだけ
  fetch(uriBase + "?" + params, {
    headers: {
      "Content-Type": "application/octet-stream",
      "Ocp-Apim-Subscription-Key": subscriptionKey
    },
    method: "POST",
    body: blob
  })
  .then(response => {
    // なにがしかの反応がAPIからあったらjsonだと思って読んでみる
    return response.json();
  })
  .then(jso => {
    // json()関数が成功したらJavaScript Objectが返ってくる罠があるのでjsonにデコードする
    // id=outputタグの内容を帰ってきたjsonで上書き
    document.getElementById("output").innerText = JSON.stringify(jso);
  })
  .catch(err => {
    // APIの呼び出しに失敗したとき
    console.log(err);  // エラー内容をコンソールに出力
  });
};

肖像権の問題があるのでスクリーンショットはありません。（面倒くさいだけ）

ハマりポイント

FileReaderで読ませた画像ファイルがそのままではどうしてもFace APIに渡せず、四苦八苦しました。

以下の記事が大変参考になりました。こちらはブラウザ上からWebカメラを起動し、ボタンを押したタイミングでキャプチャした画像を直接 Face API に渡すという上のレベルのことをしています。コピペするだけで動いて面白いのでこちらもおススメ！

JavaScriptで、画像をFaceAPIにアップロードして表情認識したい｜teratail

注意

外部ファイルの読み込みになるので、file://で表されるURLではオリジン間リソース共有(CORS)扱いになってエラーが出て、うまく処理されません。

ローカルで試す場合は、PHPやPython、Rubyなどで簡易的にHTTPサーバを立てるとよいでしょう。

shell

# PHPでHTTPサーバを立てる例
cd /path/to/src/ # index.html のあるディレクトリに移動しておく
php -S localhost:8080  # http://localhost:8080/ にアクセスするとうまく動く

注意2

API キーが丸見えになるので実用性はないぞ！

ソースコード

index.html

<!DOCTYPE html>
<html lang="ja">
<head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>Face detection</title>
  <script src="main.js"></script>
  <style>
    html, body { margin: 0; padding: 0; width: 100%; height: 100%; }
    div#img { border: solid 1px black; width: 30%; height: 30%; }
  </style>
</head>
<body>
  <div id="output"></div>
  <div id="img"></div>
</body>
</html>

main.js

function $(id) {
  return document.getElementById(id);
}

/**
 * ドロップイベント発火時に動く関数
 * 画像ファイルがドロップされたら1枚だけブラウザに読み込む
 * @param {event} e - イベントで取得した内容
 */
function handleDropAction(e) {
  // ブラウザデフォルトのイベント処理を停止
  e.preventDefault();
  e.stopPropagation();

  // ドラッグ&ドロップでブラウザに渡した画像の取得
  const droppedFiles = e.dataTransfer.files;

  // ファイルが1つ以上あれば処理開始
  if (droppedFiles.length > 0) {
    const ajaxData = new FormData();
    const file = droppedFiles[0];    // 1つ目のファイルだけ使う。あとは無視

    // 指定のファイルタイプ（画像）以外の場合はアラートを出して処理を中断
    const permitType = ["image/jpeg", "image/png", "image/gif"];
    if (file && permitType.indexOf(file.type) === -1) {
        alert("この形式のファイルはアップロードできません");
        return;
    }

    /*
     * ファイルのアップロード
     */
    ajaxData.append("file", file);  // アップロードデータを準備

    // 今開いているページにドラッグ&ドロップしたファイルを POST する 
    fetch("index.html", {
      "method": "POST",
      "body": ajaxData
    })
    .then(result => {
      // POST されたファイルを読み込み
      const fr = new FileReader();
      fr.onload = () => {
        // 読み込みが完了したとき

        // 読み込んだ画像をimgタグにしてブラウザのid=imgのdivタグ内に追加
        const image = new Image();
        image.src = fr.result;
        $("img").append(image);

        // 顔認識 API 呼び出し
        // 読み込んだファイルのDataURLを渡している
        processImage(fr.result);
      };
      // DataURL形式でドラッグ&ドロップファイルされたファイルを読み込む
      fr.readAsDataURL(file);
    })
    .catch(err => {
      // ファイルの読み込みに失敗したとき
      console.log(err);  // エラー内容をコンソールに出力
    });
  }
}

/**
 * 顔認識APIにドラッグ&ドロップした画像を投げる
 * @param {string} dataUrl - ドラッグ&ドロップしたファイルを表す DataURL
 */
function processImage(dataUrl) {
  // APIキーとエンドポイントはAzureポータルで自分で発行したものを使ってね
  const subscriptionKey = "<Subscription Key>";
  const uriBase = "https://<My Endpoint String>.com/face/v1.0/detect";

  // APIの引数をGETパラメータで渡す
  // とりあえずアリアリで
  const params = 
      "returnFaceId=true" +
      "&returnFaceLandmarks=false"+
      "&returnFaceAttributes=" +
          "age,gender,headPose,smile,facialHair,glasses,emotion," +
          "hair,makeup,occlusion,accessories,blur,exposure,noise";

  // DataURL形式の画像データをバイナリを扱えるデータ形式blobに変換する
  // この辺はコピペなので詳しくは調べてね
  const type = dataUrl.slice(5,dataUrl.indexOf(";"));  // DataURLからファイルタイプを取得
  const bin = atob(dataUrl.split(',')[1]);
  const buffer = new Uint8Array(bin.length);
  for (var i = 0; i < bin.length; i++) {
      buffer[i] = bin.charCodeAt(i);
  }
  const blob = new Blob([buffer.buffer], { type: type });

  /*
   * ドラッグ&ドロップした画像とAPIパラメータでFace APIを呼び出す
   */
  // バイナリデータなのでoctet-streamで。
  // APIキーは添えるだけ
  fetch(uriBase + "?" + params, {
    headers: {
      "Content-Type": "application/octet-stream",
      "Ocp-Apim-Subscription-Key": subscriptionKey
    },
    method: "POST",
    body: blob
  })
  .then(response => {
    // なにがしかの反応がAPIからあったらjsonだと思って読んでみる
    return response.json();
  })
  .then(jso => {
    // json()関数が成功したらJavaScript Objectが返ってくる罠があるのでjsonにデコードする
    // id=outputタグの内容を帰ってきたjsonで上書き
    $("output").innerText = JSON.stringify(jso);
  })
  .catch(err => {
    // APIの呼び出しに失敗したとき
    console.log(err);  // エラー内容をコンソールに出力
  });
};

/**
 * DOM読み込み完了時の動作
 * @param {function} loaded - DOM読み込み完了時に実行するコールバック関数
 */
function ready(loaded) {
  if (["interactive", "complete"].includes(document.readyState)) {
    loaded();
  } else {
    document.addEventListener("DOMContentLoaded", loaded);
  }
}

// DOMが読み込み完了したあとでDOMにイベントハンドラをセットする
ready(() => {
  const dropArea = $("img");

  // ドロップ領域のブラウザデフォルトのイベント処理を停止
  ["drag", "dragstart", "dragend", "dragover", "dragenter", "dragleave"].forEach(event => {
    dropArea.addEventListener(event, (e) => {
      e.preventDefault();
      e.stopPropagation();
    });
  });

  // ドロップ領域のドロップイベント発生時に呼び出される関数を設定
  dropArea.addEventListener("drop", handleDropAction);
});

【Javascript】フレームワークを使わずにドラッグアンドドロップでjsonを読み込む - Qiita

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

JavaScriptのみでAzure Face APIを実行する

TL;DR

やりたいこと

解説

ハマりポイント

注意

注意2

ソースコード

関連記事