お疲れさまです、みやもとです。
昨日書籍整理の折、作ったツールを実際に使用してみました。
実際使った感想とか、ハンズオンで作った名刺管理ツールとはこのあたりが違うかもしれないな、と思うところを書き出していきたいと思います。
全部撮って送るのは無理
結論から言うと、持っている本のすべてを撮ってLINEで送ってGeminiで読み取って…という使い方は無理でした。
Gemini側の制限
正確な計測はしていないのですが、5分以内に2件、場合によっては1件のみが処理可能なようです。
それを超えるとDifyのログにこんなエラーが出ます。
この後ろにまだ何行か出てくるエラーを眺めていくと、「API key expired. Please renew the API key.」というメッセージがあります。
作り直しても時間を空けないとまた同じエラーが出ますし、しばらく間を置いて同じキーのまま再度画像を送るとちゃんとフォーム連携されるので、どうもトークン量か何かでひっかかってる模様。
名刺の場合でも同じような感じなのかは試してみる余地がありそうですが、少なくとも書籍リストを作る場合は画像の送信をするのに間隔をあける必要がありそうです。
読み取りが不正確
大まかには読み取り成功していたのですが、フォームに設定されるタイトルや著者名にちょこちょこ間違いが見受けられました。
おそらく名刺よりもフォントの種類や文字の配置等が自由なので誤認が出てくるのでしょう。
もしかしたら先のGeminiの制限にもこのあたりが影響してるのかも、と思うので今度名刺版を改めて作って試してみたいと思います。
フォームの段階で直してしまえば問題ないのですが、うっかり見落として登録してしまうこともありました。
場合によっては手入力の方が楽
先述の通り間隔をあけて送信する必要があるというのもそうなのですが、手入力の方が楽なケースもありました。
私の蔵書に関して言えば
- 同じ著者の本
- 同じタイトルの巻数違い
というのが結構あるので、一度入力して次からは予測変換で入れる方がいちいち撮影するよりよっぽど早いということに気付きました。
それでもある方が楽
じゃあ作らなくて良かったかといえば決してそんなことはなく、例えばタイトルが2行3行に渡るとか副題が長いとか、そういう本は撮影から送信して取り込む方が楽でした。
えてしてそういう本は先に挙げた「手入力の方が楽なケース」に該当しないことが多く、長いタイトルの本にぶち当たるたび撮影して取り込み、そのあとしばらくは短いタイトルの本を入力して待ち…という感じで作業すると効率よく進めることができました。
我が家の本は平置きの本棚とクローゼットの上の棚の2か所が主な置き場で、先日時点で本棚の方だけ終わったのですが
書籍名・著者名については蔵書の趣味を公表するのが恥ずかしいので隠させていただきました。ご了承ください。
100冊を超えると全部入力はつらいものがあります。
気分転換の意味でも途中で撮影取り込みが入るのは良かったです。