transfomers 5.6.0によるQianfan-OCRサポートが、どうやら安定したようなので、アイヌ語を読ませてみることにした。Google Colaboratory (GPU版)だとこんな感じ。
!pip install 'transformers>=5.6.0' accelerate jinja2
img="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/428317/55d10bae-10b0-4a18-8e27-0907bc16361f.jpeg"
from transformers import pipeline
nlp=pipeline("image-text-to-text","baidu/Qianfan-OCR",max_new_tokens=2048,device_map="auto")
d=nlp([{"role":"user","content":[{"type":"image","image":img},{"type":"text","text":"OCR Ainu sentences."}]}])
print(d[0]["generated_text"][1]["content"])
『アイヌの美―彩りと輝き―』(京都文化博物館、2026年1月31日~3月19日)のウエランカラㇷ゚を読ませてみたところ、私(安岡孝一)の手元では以下の結果が出力された。
ウエランカラプ
令和7年度アイヌ工芸品展「アイヌの美-彩りと輝き-」アニアンレヘチコレワ、ウサム
ペカイコロチアマワエチヌカレアン。
アイヌアナケテエタワノアンクルネワ20イクネパエムコパクノヤウンモシリ、
ヤンケモシリ(カラプト)、ルトムオッタオカイ。タネヤウンモシッタカイサモロモシッタ
カイ、モシリエビッタオカイ。テエタアナケチクニ、ニカン、キナカン、チコイキナポネ、
キラウ、シキテ、ルシ、チエプカン、セイアニウサオカイベカラ。ネアンペオッタケイト
アネイウンケパカイアン。イノミオッタアネイウンケパカイアン。ピシカンモシリ
エオカイウタットゥラ、アイヌウイマムワ、センカキ、ヌイト、カネ、タマコロワネアンペ
アニピリカイカラカラピリカイヌイェアイヌキ。
タパンイキオッタイロホピリカナ、ヌベキピリカナチヌムケワチサンケ。イコロ
エチヌカレアンカトゥエネアニ。センカキトゥラアンニヌワアンカライミカイアン。
センカキトゥラアンテセワアンカラチタラベカイアン。ルトムウンクルイカラカラワ
カラクッカイアン。ヤンケモシリウンクルコロタマサイカイアンワ、ポンコンココロ
タマサイカイアン。ウサカネウサユッキラウアニアントムテイコロ、イカヨピコロ、
タンパクオナ、マキリカイアン。イノミオッタアネイウンケナートゥキ、タカイサラ、パッチ
カイアン。
ネアンペトゥラノクスロッタシクヌチカップ美恵子(1948~2010)カラペカイ
エチヌカレアン。エエパキタ、貝澤徹(イヌイェクル)、下倉洋之(カネヌイェクル)、藤戸康平
(イコロカラクル)タネウサオカイピリカナカラワコアスルアシウタンネワクスネアンペ
カイチサンケワエチヌカレアン。
タナアナケ、アイヌプリビラサクニ、公益財団法人アイヌ民族文化財団(アヌココロ
トミアニアイヌプリビラサウタラ)ケシパキナネワ、タネ30スイチキシッタン
ナ。タンペエチヌカラワ、テエタアイヌプリ、タネアンアイヌプリ、アムキリクルイソネ
チキピリカ。イョッタイオシ、タパンイキチコロテッサマ、ピリカイコロウネルサアウタラ
ウサウサウンカスイウタラ、パセタラチコヤイライケシッタンナ。
北海道立釧路芸術館
京都府
京都府京都文化博物館
公益財団法人アイヌ民族文化財団
小書きカタカナがほぼ全滅している。Qianfan-OCRは、192の言語に対応しているらしいのだけど、カタカナ書きのアイヌ語は含まれてないのかなあ。