LoginSignup
0

More than 1 year has passed since last update.

posted at

updated at

IQ Bot 帳票イメージの中の青い枠は何ですか?

IQ Botの青い枠 = SIR

IQ Botのマッピング設定画面で、帳票イメージの部分を見ると、文字が青枠で囲まれているのがわかります。
この青い枠のことを、IQ Bot用語ではSIRと呼んでいます。

何の略かは……忘れました。。。
↑System-Identified-Region だそうです。(2021.1.19追記)

SIRには、以下の意味があります。

  • ① IQ Botが文字として認識した部分がSIRの対象になる
  • ② IQ Botが意味のあるかたまりとして認識した範囲でSIRが括られる

青枠.jpg

①IQ Botが文字として認識した部分がSIRの対象になる

上記の図では、すべての文字が青枠で囲まれていました。
つまり、すべての文字をOCRが文字と認識したために、すべての文字がSIRの対象になったということです。

ですが、次の図のように癖が強いフォント(社名のロゴなど)や、画質が粗い帳票を読み込ませた場合、文字が書いてあってもSIRが形成されない場合があります。

くせがすごい文字.jpg

特殊なフォントの文字は、青枠で囲まれていませんね。

つまり、こちらはOCRが文字として認識しなかった部分ということになります。

②IQ Botが意味のあるかたまりとして認識した範囲でSIRが括られる

IQ Botは、SIRをどの範囲でくくったり分けたりするかを自動で判別しています。

以下のように、ひとつの四角になっている範囲が「IQ Botがひとかたまりとしてくくった単位」です。

IQ.jpg

SIRの制約

SIRはIQ Botが取得した結果を表示するだけの機能なので、SIRそのものをユーザーが手動でいじることはできません。

たとえば、SIRが形成されなかった範囲(=青い枠で囲まれなかった範囲=OCRが文字として認識しなかった範囲)を文字として後から認識させるようにしたり、SIRを手動でくっつけたり離したりすることはできません。

青い枠の制約.jpg

上記はあくまでも「SIRそのものを人間がいじれるか」という話で、IQ Bot全体の取得結果としてくっつけたり離したりできないよという意味ではありません。

IQ Botを触りたての人から、「この青い枠っていじれないんですか?」という質問を何度か受けたので、改めて記事にしてみた次第です。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
0