gemma-4-E2B-itはアイヌ語OCRとして使えるのか

Posted at 2026-04-03

Google DeepMindからGemma 4がリリースされたので、gemma-4-E2B-itを使ってみることにした。Google Colaboratory (GPU版)だと、こんな感じ。

!pip install 'transformers>=5.5.0' 'mistral_common>=1.11.0' accelerate jinja2
img="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/428317/55d10bae-10b0-4a18-8e27-0907bc16361f.jpeg"
from transformers import pipeline
nlp=pipeline("image-text-to-text","google/gemma-4-E2B-it",max_new_tokens=2048,device_map="auto")
d=nlp([{"role":"user","content":[{"type":"image","image":img},{"type":"text","text":"OCR Ainu sentences."}]}])
print(d[0]["generated_text"][1]["content"])

『アイヌの美―彩りと輝き―』(京都文化博物館、2026年1月31日～3月19日)のウエランカラㇷ゚を読ませてみたところ、私(安岡孝一)の手元では以下の結果が出力された。

はい、画像からOCR（光学文字認識）を試みました。以下が抽出されたテキストです。

ウエランカラプ

令和７年度アイヌ工芸品展「アイヌの美-形と彫り-と彫り-」アニンレヘチコレワ、ウサムベカイコチチアマワエチヌカレン。

アイヌアナケネテタワンアンクルネワ 20 イケネバエムコパクノヤウンモシリ、ヤンケモシリ (カラプト)、ルムオクタオカイ。タネヤウンモシタカイサモモシタタイカイ、モシリエビッタオカイ。テタアナケチクニ、ニカブ、キタカブ、チオキボネ、キラウ、シニケ、ルシ、セイアニウサオカイベカラ。ネンンベオッタケツトアイヌングファイアイヌ。イソオッタアイヌワイマ、センカキ、メイト、カネ、タマコラウネアンペ

タブンイキオッタイロホピラブス、ヌセビピリカチチョムケウチサンケ。センカキトラワアンセワアンカラチラベカイ、ルムウンクルイカラッカワラカキカイ。アンセセニ。ウサカネウサエッキラウアニトメイコ、イカボコボ、タマサイカイアン。ウサカネワエッキラウアニトメイコ、イカボコボ。

ネンアンペトラワクスロタクスチクブテマチ恵子 (1948～2010) カベカイエチヌカレン。エビバクタ、任潤徹 (イヌイクル)、下倉治之 (カネヌスネル)、藤戸康平 (イココカラク) タネナウオカイピリカフカラウコサルアウウタンネワクスネアンペカイチサンケワエチヌカレン。

タブアナケ、アイヌブリビラサクニ、公益財団法人アイヌ民族文化財団

【補足・確認】

OCRは画像に写っている文字を忠実に文字に変換していますが、一部、読み取りが難しい、あるいは文脈から推測が必要な箇所があるかもしれません。特に、人名や地名、専門用語などは、元の資料と照らし合わせて確認することをお勧めします。

やはり小書きカタカナがほぼ全滅している。Gemma 4は、140の言語をサポートしているらしいのだが、カタカナで書かれたアイヌ語をサポートする気は無いのかな。

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up