下地理則『南琉球宮古語伊良部島方言』(くろしお出版, 2018年3月)を横目に、「んなままい いㇺぬ みーらいびゃーㇺ」をUniversal Dependenciesで書いてみることにした。
# text = んなままい いㇺぬ みーらいびゃーㇺ
1 んなま _ NOUN 名詞-普通名詞-副詞可能 _ 5 obl _ SpaceAfter=No|Translit=nnama
2 まい _ ADP 助詞-係助詞 _ 1 case _ Translit=mai
3 いㇺ _ NOUN 名詞-普通名詞-一般 _ 5 nsubj _ SpaceAfter=No|Translit=im
4 ぬ _ ADP 助詞-格助詞 _ 3 case _ Translit=nu
5 みーらい _ VERB 動詞-一般 _ 0 root _ SpaceAfter=No|Translit=miːrai
6 びゃーㇺ _ PART 助詞-終助詞 _ 5 mark _ Translit=bjaːm
XPOSをUniDic品詞に合わせた上で、単語長を国語研短単位に近づける、という無茶をやってみたところ、「びゃーㇺ」を除いて、何とか私(安岡孝一)なりに納得の行く形となった。でも、このやり方だと、LEMMAを決めることができない。富浜定吉『宮古伊良部方言辞典』(沖縄タイムス社, 2013年12月)に接地することも考えたが、[bjaːm]と[bjaː]の混同に関する問題が残っている(cf. 金田章宏・下地賀代子『南琉球方言におけるベシ由来形の使用実態』(琉球の方言, Vol.39 (2015年3月), pp.141-164))らしく、なかなか難しい。このあたりのLEMMAに関する問題は、宮川創・金山博・田口智大・當山奈那『沖縄語のUniversal Dependenciesツリーバンクコーパスの構築』(言語処理学会第29回年次大会発表論文集(2023年3月), P3-8)にも方針が示されていないので、なかなか作業工程を決めることができない。さて、困ったなあ。