Universal Dependencies 2.17がリリースされた、との連絡をいただいた。半年前のUniversal Dependencies 2.16と較べて、 Central Kurdish、Southern Kurdish、Chintang、Wu Chinese (Shanghainese)、Old Occitan、Sicilian、Yiddishが増えていて、186の言語にまたがるツリーバンクとなった。私(安岡孝一)個人としては、タイ語UD_Thai-TUDが無事リリースに至ったのがうれしい。『The Thai Universal Dependency Treebank』が7月に論文採択されてたので、実を言うと気が気じゃなかったのだ。
なお、先月時点での係り受け解析ツールの状況を『Universal DependenciesとBERT/RoBERTa/DeBERTa/GPTモデルによる多言語情報処理』(2025年10月版)にざっとまとめておいたので、参考にしてほしい。