#はじめに
直前の記事 では書かなかった、table ラベル付けについて試してみたことのメモです。この記事を書いた時点では beta 版なので今後仕様が変わる可能性があります。
#table を試す
同一ページ内にテーブルが1つの場合
右向き矢印で示した table を選択した後、左向き矢印で示した一覧表を範囲指定します。
このままだと見づらいので、上向き矢印(丸1)で示したズームイン記号を選択し、拡大表示したい範囲(丸2)を指定します。左半分の元の文書イメージと、右半分の認識状態の表示がそれぞれ拡大されるタイミングはややずれることがあります。あせらず待ちましょう。table としてラベル付けした箇所にカーソルを持っていくと、上向き矢印(丸3)で示した、Annotation table が表示されます。
次はテーブルの行や列を識別する画面が表示されます。しかし、表示がまた小さくなってしまいます。これは不便ですね。再度上向き矢印(丸1)で示したズームイン記号を選択し、拡大表示したい範囲(丸2)を指定します。右向き矢印で示したメニュー(丸3)を使って Column と Row フィールド認識を開始します。
Column を選んで列(縦方向)を決めていきます。縦方向にテキストがほぼ重なって配置されている場合は、カーソルをもっていって重なりの中央付近でクリックすると簡単に認識できます。もし左寄せと右寄せが混在していて、縦方向に重なっていない場合は、同じ列として認識させたい範囲を範囲指定する必要があるようです。
同様に Row を選んで行(横方向)も決めていきます。一つのセル内でテキストを改行していたりする場合は、同じ行として認識させたい範囲を範囲指定する必要があるようです。列と行がうまく認識できると、左側の Table preview にプレビューが表示されます。
-
ちなみに間違って認識されたセル、列、行、または結合されたセルを認識から除外したい場合、認識された状態の上にカーソルを合わせていると、Remove 表示が出てきて、その時点でクリックすると除外できるようです。
-
Column と Row を認識させた後、Step2 として body 、col_header、row_title などを指定できるはずなのですが、ズームイン機能を使ってしまうと指定できないようです。
-
ちなみに Step2 の各種フィールドの使い分けかたはマニュアルをご覧ください。
テーブルの各項目の認識作業が終わったら右上の Submit table ボタンを押します。そのままだとページ内容が未確定になっています。ほかのページに移動する前には Submit page ボタンも押してください。
同一ページ内にテーブルが複数ある場合
Previous ボタン、Next ボタンで前後のテーブルに移動しながら連続して作業できるので、これは便利と思いました。
#まとめ
テーブルのデータは、View data schema の Collection view でも Build queries でも未実装のようです。将来的に改良されていくのだと思いますが、今後が楽しみですね。