#IQ Botの青い枠 = SIR
IQ Botのマッピング設定画面で、帳票イメージの部分を見ると、文字が青枠で囲まれているのがわかります。
この青い枠のことを、IQ Bot用語ではSIRと呼んでいます。
何の略かは……忘れました。。。
↑System-Identified-Region だそうです。(2021.1.19追記)
SIRには、以下の意味があります。
- ① IQ Botが文字として認識した部分がSIRの対象になる
- ② IQ Botが意味のあるかたまりとして認識した範囲でSIRが括られる
##①IQ Botが文字として認識した部分がSIRの対象になる
上記の図では、すべての文字が青枠で囲まれていました。
つまり、すべての文字をOCRが文字と認識したために、すべての文字がSIRの対象になったということです。
ですが、次の図のように癖が強いフォント(社名のロゴなど)や、画質が粗い帳票を読み込ませた場合、文字が書いてあってもSIRが形成されない場合があります。
特殊なフォントの文字は、青枠で囲まれていませんね。
つまり、こちらはOCRが文字として認識しなかった部分ということになります。
##②IQ Botが意味のあるかたまりとして認識した範囲でSIRが括られる
IQ Botは、SIRをどの範囲でくくったり分けたりするかを自動で判別しています。
以下のように、ひとつの四角になっている範囲が「IQ Botがひとかたまりとしてくくった単位」です。
#SIRの制約
SIRはIQ Botが取得した結果を表示するだけの機能なので、SIRそのものをユーザーが手動でいじることはできません。
たとえば、SIRが形成されなかった範囲(=青い枠で囲まれなかった範囲=OCRが文字として認識しなかった範囲)を文字として後から認識させるようにしたり、SIRを手動でくっつけたり離したりすることはできません。
上記はあくまでも**「SIRそのものを人間がいじれるか」という話で、IQ Bot全体の取得結果としてくっつけたり離したりできないよという意味ではありません。**
IQ Botを触りたての人から、「この青い枠っていじれないんですか?」という質問を何度か受けたので、改めて記事にしてみた次第です。