IQ Botを使い始めたばかりのとき、「インスタンスをどういう単位で切り分けるか」で迷う人が多いようです。
この話は「Excelで複数の表を同じシートに載せるか、シートを分けるか、はたまたブックを分けるか」という問題と似ていて、慣れてくれば感覚的に分け方がわかってきます。
言葉で説明すると少し長くなるかもしれませんが、一度感覚をつかんでしまえば簡単です。
……ということで、「インスタンスの切り分け方」を何回かのシリーズに分けてお伝えしたいと思います。
#前提:インスタンスとグループ
そもそもの前提として、IQ Botには「インスタンス」と「グループ」という単位があります。
インスタンスの配下にグループがあり、学習用にアップロードした帳票は、フォーマットに応じてグループごとに分類されます。
上記の図をもう少し詳しく説明したのが以下の図です。
インスタンスを作るのはユーザーで、インスタンスに学習用の帳票をアップロードするのもユーザーです。
一方、インスタンス配下のグループを分類する作業は、IQ Bot内部のAIが自動で行います。
上の図でいうと、インスタンス1にアップロードした帳票1~5のうち、「帳票1~3をグループ1に分類し、帳票4と5をグループ2に分類する」と決めるのはAIです。(分類の仕組みについての詳細はこちらを参照)
ですが、「帳票1~5をインスタンス1に、帳票6~12をインスタンス2にアップロードする」と決めるのはユーザーです。
そこで、実務では以下のようなことが問題になってくるわけです。
- 帳票1~5と6~12を別のインスタンスに切り分けるべきだと、どうやって判断すればいい?
- 帳票1~3と帳票4~5を同じインスタンスにするべきだと、どうやって判断すればいい?
このシリーズで説明するのは、その部分です。
#基本的な考え方:帳票の種類=インスタンス/フォーマットの種類=グループ
基本としては、請求書、注文書などの帳票の種類ごとにインスタンスを分ける、という考え方でまずはOKです。
請求書のインスタンスを作成し、A社とB社の請求書をまとめてアップロードすると、IQ Bot内蔵のAIがA社の請求書とB社の請求書を自動で分類してくれる。
注文書のインスタンスを作成し、X社・Y社・Z社の注文書をまとめてアップロードすると、IQ Bot内蔵のAIが各社の注文書を自動で分類してくれる。
……というイメージです。以下はその図解です。
ここではわかりやすいように「A社の請求書」などと言っていますが、IQ Botが帳票を分類する根拠はフォーマット(さらに言えば、定義した項目の分布(さらなる詳細はこちらを参照))です。
なので、A社とB社の請求書のフォーマットが酷似していたり、罫線の色が違うだけで形は同じ、などという場合は、A社とB社の請求書は同じグループに分類される場合もあります。
また、同じA社でも商品に関する請求書と、サービスに関する請求書でフォーマットが違う場合は、それぞれが別のグループに分類される場合もあります。
#基本編は以上! この先は……
基本編であるこの記事の内容は以上です。
えっ? これだけ? と思うかもしれませんが、80:20の法則でいえば、この内容さえ抑えておけば、インスタンスの切り分けの判断は8割方正しくできます。
ですが、より細かいところで、例えば以下のような疑問にお答えするために、今後もしばらくこのシリーズの続編を書いていいきたいと思います。
- 請求書は請求書でも、請求元の会社によって書いてある項目が全然違う! それでもインスタンスは同じにした方がいい?
- 電話料金の請求書と、工場の部品の請求書では使い道が全然違う! それでもインスタンスは同じにした方がいい?
- 請求書は請求書でも、製造部に来る請求書と経理部に来る請求書で参照権限を分けたい! そんな場合はどうすればいい?
- 表紙と出荷指示書と貨物の明細が束になって1部となっているような書類も、「表紙のインスタンス」「出荷指示書のインスタンス」「明細のインスタンス」のように分けなきゃダメ?