0
0

More than 3 years have passed since last update.

IQ Bot:インスタンスをどう切り分けるか Vol.1 ~基本編~

Posted at

IQ Botを使い始めたばかりのとき、「インスタンスをどういう単位で切り分けるか」で迷う人が多いようです。

この話は「Excelで複数の表を同じシートに載せるか、シートを分けるか、はたまたブックを分けるか」という問題と似ていて、慣れてくれば感覚的に分け方がわかってきます。

言葉で説明すると少し長くなるかもしれませんが、一度感覚をつかんでしまえば簡単です。

……ということで、「インスタンスの切り分け方」を何回かのシリーズに分けてお伝えしたいと思います。

前提:インスタンスとグループ

そもそもの前提として、IQ Botには「インスタンス」と「グループ」という単位があります。
インスタンスの配下にグループがあり、学習用にアップロードした帳票は、フォーマットに応じてグループごとに分類されます。
01_インスタンスとグループ.jpg
上記の図をもう少し詳しく説明したのが以下の図です。
インスタンスを作るのはユーザーで、インスタンスに学習用の帳票をアップロードするのもユーザーです。
一方、インスタンス配下のグループを分類する作業は、IQ Bot内部のAIが自動で行います。
02_インスタンスとグループ.jpg

上の図でいうと、インスタンス1にアップロードした帳票1~5のうち、「帳票1~3をグループ1に分類し、帳票4と5をグループ2に分類する」と決めるのはAIです。(分類の仕組みについての詳細はこちらを参照)

ですが、「帳票1~5をインスタンス1に、帳票6~12をインスタンス2にアップロードする」と決めるのはユーザーです。

そこで、実務では以下のようなことが問題になってくるわけです。

  • 帳票1~5と6~12を別のインスタンスに切り分けるべきだと、どうやって判断すればいい?
  • 帳票1~3と帳票4~5を同じインスタンスにするべきだと、どうやって判断すればいい?

このシリーズで説明するのは、その部分です。

基本的な考え方:帳票の種類=インスタンス/フォーマットの種類=グループ

基本としては、請求書、注文書などの帳票の種類ごとにインスタンスを分ける、という考え方でまずはOKです。

請求書のインスタンスを作成し、A社とB社の請求書をまとめてアップロードすると、IQ Bot内蔵のAIがA社の請求書とB社の請求書を自動で分類してくれる。
注文書のインスタンスを作成し、X社・Y社・Z社の注文書をまとめてアップロードすると、IQ Bot内蔵のAIが各社の注文書を自動で分類してくれる。

……というイメージです。以下はその図解です。

03_インスタンスの分け方.jpg

ここではわかりやすいように「A社の請求書」などと言っていますが、IQ Botが帳票を分類する根拠はフォーマット(さらに言えば、定義した項目の分布(さらなる詳細はこちらを参照))です。

なので、A社とB社の請求書のフォーマットが酷似していたり、罫線の色が違うだけで形は同じ、などという場合は、A社とB社の請求書は同じグループに分類される場合もあります。

また、同じA社でも商品に関する請求書と、サービスに関する請求書でフォーマットが違う場合は、それぞれが別のグループに分類される場合もあります。

基本編は以上! この先は……

基本編であるこの記事の内容は以上です。

えっ? これだけ? と思うかもしれませんが、80:20の法則でいえば、この内容さえ抑えておけば、インスタンスの切り分けの判断は8割方正しくできます。

ですが、より細かいところで、例えば以下のような疑問にお答えするために、今後もしばらくこのシリーズの続編を書いていいきたいと思います。

  • 請求書は請求書でも、請求元の会社によって書いてある項目が全然違う! それでもインスタンスは同じにした方がいい?
  • 電話料金の請求書と、工場の部品の請求書では使い道が全然違う! それでもインスタンスは同じにした方がいい?
  • 請求書は請求書でも、製造部に来る請求書と経理部に来る請求書で参照権限を分けたい! そんな場合はどうすればいい?
  • 表紙と出荷指示書と貨物の明細が束になって1部となっているような書類も、「表紙のインスタンス」「出荷指示書のインスタンス」「明細のインスタンス」のように分けなきゃダメ?

シリーズ続編の情報をいち早くキャッチしたい方は、IQぼっちIQ Botタグをぜひフォローしてください!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0