CoreMLとは?
CoreMLは、Appleが提供する機械学習フレームワークで、iOSアプリに機械学習モデルを統合するための仕組みを提供します。これにより、デバイス上での高速な推論が可能となり、プライバシーを保護しながらオフラインでも動作するAI機能を実装できます。
本記事では、Swiftコードを用いてCoreMLモデルを自作し、感情分析を行うサンプルを紹介します。
CoreMLモデルの自作
CoreMLモデルはAppleの提供する事前学習済みモデルを用いるか、既存の学習済みモデルをPythonを用い .mlmodel ファイルに変換して使うことが一般的なようです。
しかし、今回はSwiftで既存の学習モデルをトレーニングし、CoreMLモデルを作成しました。
学習モデル
そもそも学習モデルとはどういうものなのかというのを補足すると、機械学習によって訓練(トレーニング)されたデータとアルゴリズムの集合体であり、誤解を恐れずに言うと、ある種のプログラムやデータベースのようなものを指します。
モデルの具体的なイメージ
例:画像分類モデル
- 訓練データ
犬や猫などの画像データを数千枚用意し、それぞれに「犬」「猫」のラベルを付ける。 - 学習(トレーニング)
AIアルゴリズム(ニューラルネットワークなど)に画像とラベルを繰り返し学習させることで、特徴(耳の形や体のシルエットなど)を認識できるようにする。 - 出力されたモデル
トレーニングの結果、未知の画像が与えられたときに「犬」または「猫」と分類できるファイルが生成される。このファイルがCore MLの モデル です(拡張子は.mlmodel)。
モデルの役割
Core MLのモデルは、次の2つの要素を含んでいます
- パラメータ(知識)
学習結果として得られた係数やパターン(例:犬の耳の形や猫の目の位置などの特徴量)。 - アルゴリズム
入力データを解析し、パラメータを基に結果を予測する仕組み(ニューラルネットワークや決定木など)。
このモデルは学習の過程でチューニングされたものであり、 ユーザーがコードを書く必要はありません。 アプリはこのモデルにデータを渡すだけで推論結果を得られます。
モデルの自作
では、前置きはこれくらいにして、実際にモデルを自作してみたいと思います。
今回作成したのは、文章を入力し、それがポジティブ・ネガティブ・ニュートラルのどれに分類されるかを判別する感情分析モデルです。
基本的にはApple公式ドキュメントを参照しています。
https://developer.apple.com/documentation/CreateML/creating-a-text-classifier-model
ただ、このドキュメントだけではモデル作成までに至らなかったので、ポイントを併せて紹介できればと思います。
具体的な流れは以下の通りです。
- データセットの準備
- モデル出力用のプロジェクト作成
- モデル出力用のプログラム作成
- サンプルプロジェクトでモデルをプレビューする
実装手順
1. データセットの準備
感情分析用のデータセットとして、以下のようなjson形式のデータを用意しました。
[
{
"text": "今日は特にこれといった出来事はなく、いつも通りの日常を過ごした。",
"label": "neutral"
},
{
"text": "美味しいケーキを食べて、心が満たされた一日だった。",
"label": "positive"
},
{
"text": "大切にしていた物をなくしてしまい、心が痛い。",
"label": "negative"
},
...
]
2. モデル出力用のプロジェクト作成
Xcodeで新規プロジェクトを作成する際に「Command Line Tool」を選択します。
3. モデル出力用のプログラム作成
先ほど作成したプロジェクト内に ModelTrainer.swift を新規作成します。
import Foundation
import CreateML
import TabularData
struct ModelTrainer {
func trainAndSaveModel() {
do {
// モデルトレーニングとそのトレーニングしたモデルを保存する処理を描く
} catch {
// 例外処理
}
}
}
続いて用意したjsonを読み込み、DataFrameという形式に変換します
let currentDirectoryURL = URL(fileURLWithPath: FileManager.default.currentDirectoryPath)
let bundleURL = URL(fileURLWithPath: "JSONMocks.bundle", relativeTo: currentDirectoryURL)
guard let bundle = Bundle(url: bundleURL),
let url = bundle.url(forResource: "sentiment", withExtension: "json") else {
print("JSONファイルが見つかりません")
return
}
let dataFrame = try DataFrame(contentsOfJSONFile: url)
ここで注意が必要なのが、このプロジェクトにはBundleがないということです。
そのため、jsonファイルをバンドルさせるためのターゲットを追加してあげる必要があります。
そして作成したバンドルに用意したjsonを追加してあげます。
これでバンドルのURLが取得できるようになったので、そこからファイルのURLを取得し、DataFrameに渡してあげています。
続いて読み込んだデータをトレーニングデータとテストデータに分割してあげます。
公式のドキュメントを読むと8:2にするといいと書いていたので、そのようにします。
let (trainingData, testingData) = dataFrame.stratifiedSplit(
on: "label",
by: 0.8
)
さらに、トレーニング用のパラメータを設定してあげます。
ここら辺も公式ドキュメントのままです。言語だけ日本語に変えました。
let parameters = MLTextClassifier.ModelParameters(
validation: .split(strategy: .automatic),
algorithm: .transferLearning(.bertEmbedding, revision: 1),
language: .japanese
)
ここまでで準備ができたので、いよいよモデルのトレーニング処理を書いていきます。
すでに元となるテキスト分類の学習モデルがあるので、これを使って感情分類のトレーニングを行い、その結果のモデルを出力させるということをしていきます。
まずは準備したトレーニング用のデータとパラメータを渡して MLTextClassifier のインスタンスを作成します。MLTextClassifier は trainingData を渡してインスタンスを生成した時点で、内部的にトレーニングが行われます。
let classifier = try MLTextClassifier(
trainingData: trainingData,
textColumn: "text",
labelColumn: "label",
parameters: parameters
)
これで感情分析用のモデルができたはずなので、今度はこのモデルを保存する処理を書きます。
let metadata = MLModelMetadata(
author: "gdate",
shortDescription: "感情分析モデル",
version: "1.0"
)
let saveURL = FileManager.default.temporaryDirectory.appendingPathComponent("SentimentClassifier.mlmodel")
try classifier.write(to: saveURL, metadata: metadata)
print("モデルを保存しました: \(saveURL)")
最後にmain.swiftでこのModelTrainerを実行させる処理を書き、ビルドすればmlmodelが出力されます。
let trainer = ModelTrainer()
trainer.trainAndSaveModel()
4. サンプルプロジェクトでモデルをプレビューする
まず、エクスポートした SentimentClassifier.mlmodel をXcodeのプロジェクトに追加します。すると以下のような画面になると思います。
タブにPreviewというのがあると思うのでそちらをクリックします。
この入力欄に文章を入力してみると、作ったモデルが感情分析をしてくれます。
与えるデータを変えることで結果も異なりますので、用途に応じたデータを用意し、学習させてあげることで色々な使い道がありそうだなと思いました
参考
https://developer.apple.com/documentation/CreateML/creating-a-text-classifier-model
https://developer.apple.com/jp/documentation/createml/creating_a_text_classifier_model/