Universal Dependencies 2.14がリリースされた、との連絡をいただいた。半年前のUniversal Dependencies 2.13と較べて、Abkhazian、Azerbaijani、Bavarian、Cappadocian Greek、Egyptian (Ancient)、Gujarati、Hausa、Latgalian、Luxembourgish、Maghrebi Arabic French、Ottoman Turkish、Paumarí、Tswanaが増えており、161の言語にまたがるツリーバンクとなった。古典中国語(漢文)に関しては、私(安岡孝一)のグループが製作しているUD_Classical_Chinese-Kyotoに加え、テュービンゲン大学のグループがUD_Classical_Chinese-TueCLの製作を開始した。
なお、先月時点での係り受け解析ツールの状況を『Universal DependenciesとBERT/RoBERTa/DeBERTaモデルによる多言語情報処理』(2024年4月版)にざっとまとめておいたので、参考にしてほしい。