はじめに
Geminiでどのくらいの精度で文字を読み取れるのかを検証してみました。
検証で使用したコードはGit hubで確認してください!
前回に引き続き遊んでいきます!
Geminiの使い方はこちらの記事を参考に
コード全体
結論
- 完璧な読み込みは厳しいが、文字が綺麗で行と列が揃っている写真は綺麗に読み取れることがわかった。
- 要約を付けると少しの読み取り間違えがあっても意味が通る。
- どのように読み取りたいのかをしっかり記述しないと想定外の返しが来る。
検証
写真内の文字をそのまま出力出来るのかと認識した文字を要約するとどうなるのかを検証する。
文字プロンプトは固定し、画像のみを変更。
以下に使用したプロンプトを示す。
プロンプト
文字認識:"写真内の文字をそのまま出力してください。"
文字認識+要約:"写真内の文字を要約して出力してください。"
data1
文字認識
Wishing you a prosperous new year
文字認識+要約
新年あけましておめでとうございます。
data2
文字認識
非木材料物【編纂】 紙の原料として使われる非木本植物には、次のようなものがある。いずれも、安定供給や品質の面から木本の代替えにはならないとされており、現在では特別な用途で使われている。
アザ アザヤヤはその昔、中国で紙が発生したときの主要原料だった(リネンパルプとともに。中国・カンボジア・ゴヨウ・ミゾハギなどは木本であるが紙の原料として用いられたことはない。また、ミズマメは日本紙幣の原料となったことがある)。
竹 竹材は、中国で春秋時代(7世紀~紀元前5世紀)頃から、秦(紀元前3世紀)に伝わった紙(幅広さ約25cm)は、四川省で作られたもので、縦に2分割して使われた。また、日本でも1890年頃、中国で製造された竹紙を輸入して試験的に紙幣に使用したが、耐久性が悪く採用されなかった。現在では、トイレットペーパー、紙おむつ、紙袋などの原料となっている。
藁 古くは小麦わらなどが、中国で紙の主要原料となった。ヨーロッパでも、木綿麻以外の紙は、イスラム世界で紙の主原料となった。
木綿 紀元前3世紀頃、 भारतで木綿が栽培され、やがて中国に伝わった。L.H.Chenによると、中国最初の木綿栽培は唐の大暦年間(西暦766~779)であり、15世紀に印刷技術が確立して紙需要が拡大するまで、木綿は、衣服や布団などの日用品や、燈火(とうか、油を染み込ませた芯に火をつけてともす明かり)の原料として栽培・利用されてきた。日本では、江戸時代から明治にかけて、木綿パルプ(リント)が、洋紙や半紙の原料として輸入され、今日に至るまで紙の原料とされている。
サトウキビ インド・中国や南米原産。糖蜜を生成したあと残渣(バガス)を原料としたパルプは、フィリピンなど東南アジア諸国で、また、メキシコやブラジルでも生産されている。
マニラ麻 マニラ麻(アバカ)は、フィリピン原産の多年草で、おもに繊維の原料とする。日本では紙幣の主要原料となっているが、最近は産地が限られていることなどから、パルプ用マニラ麻の輸入は減少している。
文字認識+要約
非木材料物(繊維) 紙の原料として使われる非木本植物には、次のものがある。いずれも、安定供給や品質の面から木本の代替にはならないとされており、現在では特別な用途で使われている。
アザ アザヤヤはその昔、中国で紙が発明されたときの主要原料だった(リネンパルプ)とされている。中国・ヨーロッパ・アメリカなど諸説あるが、このうち最も有力な原料とされている。また、ミズアザミは日本紙幣の原料としても採用されている。
竹 竹材は、中国で古くから紙の原料として使われており、宋代(10世紀頃)には紙の主要原料となった(唐代には、麻や菜種が主原料だった)。四川省など中国南部で栽培され、日本にも古くから輸入されていた。
藁 藁(稲わら)は、中国で古くから紙の原料とされてきた。前漢の時代から、麻や竹などと混入して紙がつくられた。また、日本でも1890年頃までは、新聞紙などに使われていたが、その後は、輸入パルプに置き換えられていった。
木綿 木綿はよく燃えるため、イスラム世界で紙の主要原料となった。ヨーロッパでも、麻紙が普及するまでは、木綿を使った紙がつくられていた。
本紙 紀元前3世紀頃、 भारतで木綿や麻の繊維を原料とした紙がつくられた。L.H.チェンは、 भारतで印刷技術が発明され、紙需要が拡大したことが、世界に紙を広めた要因のひとつと指摘している。また、中国では、唐の時代に、木綿や麻などの原料を原料とした紙がつくられた。日本では、平安時代初期の810年代に、空海(弘法大師)が、唐から製紙法を伝えたとされている。その後、鎌倉時代から室町時代にかけて、越前や土佐などで紙すきが行われるようになった。
サトイモ インド・中国や東南アジアで、戦国時代~江戸時代にかけて、サトイモの茎の繊維(リウゲン)からパルプをつくり、紙がつくられた。また、ミャンマーでは、現在でも、サトイモが紙の原料となっている。
マニラ麻 マニラ麻(アバカ)は、フィリピンなど東南アジア原産の多年草の植物で、日本和紙の主要原料のひとつである。しなやかで強靭な繊維が特徴で、紙幣や証券、テッシュペーパー、紙おむつ、輸出品梱包機の紙バックの原料などに使われている。
data3
文字認識
925-609-7677
文字認識+要約
写真には「925-60F-V67F」と手書きで書かれています。
data4
文字認識
・中国野菜は、中国原産、または中国で大きく品種改良されてきている野菜。中国から日本へ伝わった野菜の数が多いが、一般に「中国野菜」と呼んでいるものの多くは、1972年の日中国交正常化以降、食品専門商社の手にって中国から日本への輸出が始まってまもない野菜のことと指摘する。現在日本に出回っている中国野菜は、日本へ改良された16種程度のものがあるといわれる。
文字認識+要約
・中国野菜は、中国原産、または中国で大きく品種改良されてきている野菜。中国から日本へ伝わった野菜の数が多いが、一般に「中国野菜」と呼んでいるものの多くは、1972年の日中国交正常化以降、食品専門商社の手にって中国から日本への輸人が始まり広まっていった野菜のことと指摘する。現在日本に出回っている中国野菜は、日本でも改良され、16種程度のものがあることが知られる。
まとめ
- 結果から綺麗に整備されている文字などはしっかりと読み込むことができた。
- 手書き文字は読み取るのが難しそう、、、
- data1はすごく簡単に要約されてしまった
- PDFなどを写真にして読み込めば、要約できるかも?
おわりに
最後までご覧いただきありがとうございます!
今回はGeminiでOCRに挑戦してみてました。
初学者のため情報に誤りがある可能せいがあります。
ご了承ください。
参考画像
data2,data3の画像