0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Qwen3.5-4Bはアイヌ語OCRとして使えるのか

0
Posted at

Qwen3.5-4Bがリリースされたので、京都文化博物館「アイヌの美―彩りと輝き―」(2026年1月31日~3月19日)のウエランカラㇷ゚を読ませてみた。Google Colaboratory (GPU版)だと、こんな感じ。

!pip install 'transformers>=5.2.0' accelerate jinja2
img="https://qiita-image-store.s3.ap-northeast-1.amazonaws.com/0/428317/55d10bae-10b0-4a18-8e27-0907bc16361f.jpeg"
from transformers import pipeline
nlp=pipeline("image-text-to-text","Qwen/Qwen3.5-4B",max_new_tokens=8192,device_map="auto")
d=nlp([{"role":"user","content":[{"type":"image","image":img},{"type":"text","text":"OCR Ainu sentences."}]}])
print(d[0]["generated_text"][1]["content"])

私(安岡孝一)の手元では、以下の結果が出力された。

The user wants me to OCR the text in the image.
The text is in the Ainu language (specifically, it looks like a transcription of Ainu using Katakana, which is common for Ainu texts).

**Step 1: Transcribe the text block by block.**

*   **Title:** ウェランカラプ (Werankarapu)

*   **First Paragraph:**
    令和7年度アイヌ工芸品展「アイヌの美-彩りと輝き-」アニ アン レヘ チコレ ワ、ウサム
    ベカ イコロ チアマ ワ エチヌカレアン。
    アイヌ アナクネ テエタ ワノ アン クル ネ ワ 20 イク ネ バ エムコ パッノヤウンモシリ、
    ヤンケモシリ(カラブト)、ルトム オッタ オカイ。タネ ヤウンモシリ タ カイサモロモシッ タ
    カイ、モシリ エビッタ オカイ。テエタ アナクネ チクニ、ニカブ、キナカブ、チコイキア ポネ、
    キラウ、シキテ、ルシ、チェブカブ、セイ アニ ウサ オカイ ベ カラ。ネアンペ オッタ ケスト
    アネイワンケ ン カイ アン。イノミ オッタ アネイワンケ ン カイ アン。ピシカン モシリ
    エオカイ ウッタ トゥラ、アイス ウイマム ワ、センカキ、ヌイト、カネ、タマ コロ ワ ネアンペ
    アニ ビリカ イカラカラ ビリカ イヌイェアイス キ。

*   **Second Paragraph:**
    タパン イキ オッタ イロホ ビリカ ン、スペキ ビリカ ン チヌメケ ワ チサンケ。イコロ
    エチヌカレアン カトゥ エネアニ。センカキ トゥラ アンニス ワ アンカラ イミカイ アン。
    センカキ トゥラ アンテセ ワ アンカラ チトラペ カイ アン。ルトム ウンクル イカラカラ ワ
    カラ クク カイ アン。ヤンケモシリ ウン クル コロ タマサイ カイアン ワ、ボン コンコ コロ
    タマサイ カイ アン。ウサ カネ ウサ ユッキラウ アニ アントムテ イコロ、イカヨビコロ、
    タンパクオプ、マキリ カイ アン。イノミ オッタ アネイワンケ ポートゥキ、タカイサラ、パッチ
    カイ アン。

*   **Third Paragraph:**
    ネアンペ トゥラノ クスロッ タ シクス チカップ美恵子(1948〜2010)カラ ベ カイ
    エチヌカレアン。エエパキタ、貝澤徹(イヌイェクル)、下倉洋之(カネヌイェクル)、藤戸康平
    (イコロカラクル)タネ ウサ オカイ ビリカ ン カラ ワ コアスルアシ ウタン ネ ワ クス ネアンペ
    カイ チサンケ ワ エチヌカレアン。

*   **Fourth Paragraph:**
    タパ アナクネ、アイヌプリ ビラサ クニ、公益財団法人アイヌ民族文化財団(アヌコロ
    トミ アニ アイヌプリ ビラサ ウタラ)ケシ パ キ ブ ネ ワ、タネ 30 スイ チキ シッタン
    ナ。タンペ エチヌカラ ワ、テエタ アイヌプリ、タネ アン アイヌプリ、アムキル クル インネ
    チキ ビリカ。イヨッタ イオシ、タパン イキ チコロ テッサマ、ビリカイコロ ウネルサ ア ウタラ
    ウサ ウサ ウンカスイ ウタラ、パセタラ チコヤライケ シッタン ナ。

*   **Footer/Signatures:**
    北海道立釧路芸術館
    京都府
    京都府京都文化博物館
    公益財団法人アイヌ民族文化財団

**Step 2: Review and Format.**
I will present the text exactly as it appears in the image, preserving the line breaks and paragraph structure. I will use the Katakana characters as they appear.

*   *Self-Correction during transcription:*
    *   "ウェランカラプ" -> Werankarapu
    *   "令和7年度" -> Reiwa 7th year
    *   "アイヌ工芸品展" -> Ainu Craft Exhibition
    *   "「アイヌの美-彩りと輝き-」" -> "Beauty of Ainu - Color and Brilliance -"
    *   "アニ アン レヘ" -> Ani an rehe (To the Ainu people)
    *   "チコレ ワ" -> Chicore wa (Thank you)
    *   "ウサム ベカ" -> Usamu beka (To the people of the land)
    *   "イコロ チアマ ワ" -> Ikorochiama wa (To the people of the sea)
    *   "エチヌカレアン" -> Etinukarean (To the people of the mountains)
    *   "アイヌ アナクネ" -> Ainu anakune (To the Ainu people)
    *   "テエタ ワノ" -> Teeta wano (To the Ainu people - wait, "Teeta" usually means "Ainu" in some contexts, or "people". Let's stick to the visual text: テエタ ワノ)
    *   "アン クル ネ ワ" -> An kuru ne wa (To the people of the land)
    *   "20 イク ネ バ" -> 20 iku ne ba (20 people)
    *   "エムコ パッノヤウンモシリ" -> Emko panno yunmosiri (The people of the land)
    *   "ヤンケモシリ(カラブト)" -> Yankemosiri (Karatuto)
    *   "ルトム" -> Rutomu
    *   "オッタ オカイ" -> Otta okai (To the people of the sea)
    *   "タネ" -> Tane (To the people of the mountains)
    *   "ヤウンモシリ" -> Yunmosiri
    *   "タ カイサモロモシッ タ カイ" -> Ta kaisamoromositta kai (The people of the land)
    *   "モシリ エビッタ オカイ" -> Mosiri ebitta okai (To the people of the sea)
    *   "テエタ アナクネ" -> Teeta anakune (To the Ainu people)
    *   "チクニ" -> Chikuni
    *   "ニカブ" -> Nikabu
    *   "キナカブ" -> Kinakabu
    *   "チコイキア" -> Chikoikia
    *   "ポネ" -> Pone
    *   "キラウ" -> Kirau
    *   "シキテ" -> Shikite
    *   "ルシ" -> Rusi
    *   "チェブカブ" -> Chebukabu
    *   "セイ" -> Sei
    *   "アニ ウサ" -> Ani usa (To the people of the sea)
    *   "オカイ ベ カラ" -> Okai be kara (To the people of the mountains)
    *   "ネアンペ" -> Neanpe
    *   "オッタ ケスト" -> Otta keso (To the people of the land)
    *   "アネイワンケ ン カイ アン" -> Anaiwanke n kai an (To the people of the sea)
    *   "イノミ" -> Inomi
    *   "ピシカン" -> Pishikan
    *   "モシリ エオカイ" -> Mosiri eo kai (To the people of the mountains)
    *   "ウッタ トゥラ" -> Utta tura (To the people of the land)
    *   "アイス" -> Aisu
    *   "ウイマム ワ" -> Uimamu wa (To the people of the sea)
    *   "センカキ" -> Senkaki
    *   "ヌイト" -> Nuito
    *   "カネ" -> Kane
    *   "タマ コロ ワ" -> Tama korowa (To the people of the mountains)
    *   "ネアンペ アニ" -> Neanpe ani (To the people of the land)
    *   "ビリカ" -> Birika
    *   "イカラカラ" -> Ikarakara
    *   "ビリカ イヌイェアイス キ" -> Birika inuyeaisu ki (To the people of the sea)

    *   "タパン" -> Tapan
    *   "イキ オッタ" -> Iki otta (To the people of the land)
    *   "イロホ" -> Iroho
    *   "ビリカ ン" -> Birika n (To the people of the sea)
    *   "スペキ" -> Speki
    *   "ビリカ ン" -> Birika n (To the people of the sea)
    *   "チヌメケ ワ" -> Chinumeke wa (To the people of the mountains)
    *   "チサンケ" -> Chisanke
    *   "イコロ" -> Ikorochiama
    *   "エチヌカレアン" -> Etinukarean
    *   "カトゥ" -> Katu
    *   "エネアニ" -> Enenani
    *   "センカキ トゥラ" -> Senkaki tura
    *   "アンニス ワ" -> Annisu wa (To the people of the mountains)
    *   "アンカラ" -> Ankara
    *   "イミカイ アン" -> Imikai an (To the people of the sea)
    *   "センカキ トゥラ アンテセ ワ" -> Senkaki tura antese wa
    *   "アンカラ チトラペ" -> Ankara chitrape
    *   "カイ アン" -> Kai an (To the people of the sea)
    *   "ルトム ウンクル" -> Rutomu unku
    *   "イカラカラ ワ" -> Ikarakara wa
    *   "カラ クク" -> Kara kuku
    *   "カイ アン" -> Kai an (To the people of the sea)
    *   "ヤンケモシリ ウン クル" -> Yankemosiri unku
    *   "コロ タマサイ" -> Korotamasai
    *   "カイアン ワ" -> Kaiyan wa (To the people of the mountains)
    *   "ボン コンコ" -> Bon konko
    *   "コロ タマサイ" -> Korotamasai
    *   "カイ アン" -> Kai an (To the people of the sea)
    *   "ウサ カネ" -> Usa Kane
    *   "ウサ ユッキラウ" -> Usa yukkirau
    *   "アニ アントムテ" -> Ani antomute
    *   "イコロ" -> Ikorochiama
    *   "イカヨビコロ" -> Ikayobikoro
    *   "タンパクオプ" -> Tanpakauopu
    *   "マキリ" -> Makiri
    *   "カイ アン" -> Kai an (To the people of the sea)
    *   "イノミ オッタ" -> Inomi otta
    *   "アネイワンケ" -> Anaiwanke
    *   "ポートゥキ" -> Portuki
    *   "タカイサラ" -> Takaisara
    *   "パッチ カイ アン" -> Patchi kai an (To the people of the sea)

    *   "ネアンペ" -> Neanpe
    *   "トゥラノ" -> Tura no
    *   "クスロッ タ" -> Kusrotta
    *   "シクス" -> Shikusu
    *   "チカップ" -> Chikappu
    *   "美恵子(1948〜2010)" -> Mieko (1948-2010)
    *   "カラ ベ カイ" -> Kara be kai
    *   "エチヌカレアン" -> Etinukarean
    *   "エエパキタ" -> Eepakita
    *   "貝澤徹(イヌイェクル)" -> Kaizawa Toru (Inuye kuru)
    *   "下倉洋之(カネヌイェクル)" -> Shimokura Hiroshi (Kane nuye kuru)
    *   "藤戸康平(イコロカラクル)" -> Fujido Yasuharu (Ikorokarukuru)
    *   "タネ ウサ オカイ" -> Tane usa okai
    *   "ビリカ ン" -> Birika n
    *   "カラ ワ" -> Kara wa
    *   "コアスルアシ" -> Koasurashi
    *   "ウタン ネ ワ" -> Utan ne wa
    *   "クス ネアンペ" -> Kusu neanpe
    *   "カイ チサンケ ワ" -> Kai chisanke wa
    *   "エチヌカレアン" -> Etinukarean

    *   "タパ アナクネ" -> Tapu anakune
    *   "アイヌプリ" -> Ainupuri
    *   "ビラサ クニ" -> Birasa kuni
    *   "公益財団法人アイヌ民族文化財団(アヌコロトミ アニ アイヌプリ ビラサ ウタラ)" -> Public Corporation Ainu National Culture Foundation (Anukorotomi ani Ainupuri birasa utara)
    *   "ケシ パ キ ブ ネ ワ" -> Keshi pa ki bu ne wa
    *   "タネ 30 スイ チキ シッタン ナ" -> Tane 30 sui chiki shittan na
    *   "タンペ エチヌカラ ワ" -> Tanpe etinukara wa
    *   "テエタ アイヌプリ" -> Teeta ainupuri
    *   "タネ アン アイヌプリ" -> Tane an ainupuri
    *   "アムキル クル インネ チキ ビリカ" -> Amukiru kuru inne chiki birika
    *   "イヨッタ イオシ" -> Iyotta ioji
    *   "タパン イキ" -> Tapan iki
    *   "チコロ" -> Chikoro
    *   "テッサマ" -> Tessama
    *   "ビリカイコロ" -> Birikakoro
    *   "ウネルサ ア" -> Unerusa a
    *   "ウタラ ウサ ウサ" -> Utara usa usa
    *   "ウンカスイ ウタラ" -> Unkasui utara
    *   "パセタラ" -> Pasetara
    *   "チコヤライケ" -> Chikoyaraike
    *   "シッタン ナ" -> Shittan na

    *   "北海道立釧路芸術館" -> Hokkaido Kushiro Art Museum
    *   "京都府" -> Kyoto Prefecture
    *   "京都府京都文化博物館" -> Kyoto Prefectural Kyoto Museum of Art
    *   "公益財団法人アイヌ民族文化財団" -> Public Corporation Ainu National Culture Foundation

The transcription looks solid. I will output the text block by block.
</think>

ウェランカラプ
令和7年度アイヌ工芸品展「アイヌの美-彩りと輝き-」アニ アン レヘ チコレ ワ、ウサム
ベカ イコロ チアマ ワ エチヌカレアン。
アイヌ アナクネ テエタ ワノ アン クル ネ ワ 20 イク ネ バ エムコ パッノヤウンモシリ、
ヤンケモシリ(カラブト)、ルトム オッタ オカイ。タネ ヤウンモシリ タ カイサモロモシッ タ
カイ、モシリ エビッタ オカイ。テエタ アナクネ チクニ、ニカブ、キナカブ、チコイキア ポネ、
キラウ、シキテ、ルシ、チェブカブ、セイ アニ ウサ オカイ ベ カラ。ネアンペ オッタ ケスト
アネイワンケ ン カイ アン。イノミ オッタ アネイワンケ ン カイ アン。ピシカン モシリ
エオカイ ウッタ トゥラ、アイス ウイマム ワ、センカキ、ヌイト、カネ、タマ コロ ワ ネアンペ
アニ ビリカ イカラカラ ビリカ イヌイェアイス キ。
タパン イキ オッタ イロホ ビリカ ン、スペキ ビリカ ン チヌメケ ワ チサンケ。イコロ
エチヌカレアン カトゥ エネアニ。センカキ トゥラ アンニス ワ アンカラ イミカイ アン。
センカキ トゥラ アンテセ ワ アンカラ チトラペ カイ アン。ルトム ウンクル イカラカラ ワ
カラ クク カイ アン。ヤンケモシリ ウン クル コロ タマサイ カイアン ワ、ボン コンコ コロ
タマサイ カイ アン。ウサ カネ ウサ ユッキラウ アニ アントムテ イコロ、イカヨビコロ、
タンパクオプ、マキリ カイ アン。イノミ オッタ アネイワンケ ポートゥキ、タカイサラ、パッチ
カイ アン。
ネアンペ トゥラノ クスロッ タ シクス チカップ美恵子(1948〜2010)カラ ベ カイ
エチヌカレアン。エエパキタ、貝澤徹(イヌイェクル)、下倉洋之(カネヌイェクル)、藤戸康平
(イコロカラクル)タネ ウサ オカイ ビリカ ン カラ ワ コアスルアシ ウタン ネ ワ クス ネアンペ
カイ チサンケ ワ エチヌカレアン。
タパ アナクネ、アイヌプリ ビラサ クニ、公益財団法人アイヌ民族文化財団(アヌコロ
トミ アニ アイヌプリ ビラサ ウタラ)ケシ パ キ ブ ネ ワ、タネ 30 スイ チキ シッタン
ナ。タンペ エチヌカラ ワ、テエタ アイヌプリ、タネ アン アイヌプリ、アムキル クル インネ
チキ ビリカ。イヨッタ イオシ、タパン イキ チコロ テッサマ、ビリカイコロ ウネルサ ア ウタラ
ウサ ウサ ウンカスイ ウタラ、パセタラ チコヤライケ シッタン ナ。
北海道立釧路芸術館
京都府
京都府京都文化博物館
公益財団法人アイヌ民族文化財団

空白は残っているものの、小書きカタカナはほぼ全滅である。Qwen3.5は、201の言語に対応しているらしいのだけど、カタカナ書きのアイヌ語は含まれてないのかなあ。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?