Qwen3.5-2Bをファインチューニングする形で、カタカナアイヌ語OCRモデルQwen3.5-2B-AinuOCRを試作してみた。小書きカタカナのトークン追加については、3月21日の記事の手法をほぼ踏襲した。Google Colaboratory (GPU版)で動かしてみよう。
!pip install 'transformers>=5.2.0' accelerate jinja2
img="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/428317/55d10bae-10b0-4a18-8e27-0907bc16361f.jpeg"
from transformers import pipeline
nlp=pipeline("image-text-to-text","KoichiYasuoka/Qwen3.5-2B-AinuOCR",max_new_tokens=8192,device_map="auto")
d=nlp([{"role":"user","content":[{"type":"image","image":img},{"type":"text","text":"OCR Ainu sentences."}]}])
print(d[0]["generated_text"][1]["content"])
『アイヌの美―彩りと輝き―』(京都文化博物館、2026年1月31日~3月19日)のウエランカラㇷ゚を読ませてみたところ、私(安岡孝一)の手元では、以下の結果が出力された。
ウエランカラㇷ゚
令和7年度アイヌ工芸作品展「アイヌの美-彩りと輝き-」アニ アン レヘ チコレ ワ、ウサㇺ
ベカ イコㇿ チアマ ワ エチヌカレアン。
アイヌ アナㇰネ テエタ ワノ アン クㇽ ネ ワ 20 イㇰ ネ パ エㇺコ パッノ ヤウンモシリ、
ヤンケモシリ(カラプト)、ルトム オッタ オカイ。タネ ヤウンモシッタ カイ サモロモシッタ
カイ、モシリ エピッタ オカイ。テエタ アナㇰネ チㇰニ、ニカデ、キナカデ、チコイキナ ポネ、
キラウ、シキテ、ㇽシ、チェブカデ、セイ アニ ウサ オカイ ペ カㇻ。ネアンペ オッタ ケスト
アネイワンケ プ カイ アン。イノミ オッタ アネイワンケ プ カイ アン。ピㇱカン モシリ
エオカイ ウタットゥㇻ、アイヌ ウイマㇺ ワ、センカキ、ヌイト、カネ、タマ コロ ワ ネアンペ
アニ ビㇼカ イカㇻカㇻ ビㇼカ イヌイエ アイヌ キ。
タパン イㇰ オッタ イロホ ビㇼカ プ、ヌペキ ビㇼカ プ チヌㇺケ ワ チサンケ。イコㇿ
エチヌカレアン カトゥ エネアニ。センカキ トゥㇻ アンニヌ ワ アンカㇻ イミ カイ アン。
センカキ トゥㇻ アンデセ ワ アンカㇻ チタラペ カイ アン。ルトム ウンㇰ イカㇻカㇻ ワ
カㇻ クッ カイ アン。ヤンケモシリ ウン クㇽ コㇿ タマサイ カイアン ワ、ポン コンコ コㇿ
タマサイ カイ アン。ウサ カネ ウサ ユッキㇻウ アニ アントムテ イコㇿ、イカヨピコㇿ、
タンプㇰオパ、マキㇼ カイ アン。イノミ オッタ アネイワンケ ポトゥキ、タカイサラ、パッチ
カイ アン。
ネアンペ トゥㇻノ クスㇿッタ シㇰヌ チカップ美恵子(1948〜2010)カㇻ ペ カイ
エチヌカレアン。エエパキタ、貝澤徴(イヌイェクル)、下倉洋之(カネヌイェクル)、藤戸康平
(イコㇿカㇻクル)タネ ウサ オカイ ビㇼカ プ カㇻ コアㇲㇽアシ ウタン ネ ワ クス ネアンペ
カイ チサンケ ワ エチヌカレアン 。
タパ アナㇰネ、アイヌスプリ ビラサ クニ、公益財団法人アイヌ民族文化財団(アヌコㇿ
トミ アニ アイヌスプリ ビラサ ウタㇻ)ケシ パ キ プ ネ ワ、タネ 30 スイ チキ シッタン
ナ。タンプ エチヌカㇻ ワ、テエタ アイヌスプリ、タネ アン アイヌスプリ、アムキㇼ クㇽ インネ
チキ ビㇼカ。イョッタ イオシ、タパン イキ チコㇸ テッサマ、ピㇼカイコㇿ ウネルサ ア ウタㇻ
ウサ ウサ ウンカスイ ウタㇻ、パセタㇻ チコヤイライケ シッタン ナ。
北海道立釧路芸術館
京都府
京都府京都文化博物館
公益財団法人アイヌ民族文化財団
小書きカタカナがかなり読めるようになったものの、まだまだ追加訓練が必要なようだ。Qwen3.5-0.8B-AinuOCRとQwen3.5-4B-AinuOCRも試作してみたので、ぜひ使ってみてほしい。