More than 3 years have passed since last update.

「わかち書き」不要のCharformerをGoogle&DeepMindが発表

Last updated at 2021-07-30Posted at 2021-07-30

1カ月ほど前にGoogleとDeepMindが発表した、"Charformer"に関する論文を紹介します。

この論文では自然言語処理の前処理でよく行われている「トークン化」を自動化したモジュールを導入しています。

"Charformer"は"Character"と"Transformer"をくっつけた言葉で、文字単位の分析にTransformersの手法を応用しているようです。

Qiitaで"Charformer"と検索しても１件もヒットしなかったので、Qiita上での第一報かと存じます。

詳細な解説は私の手に余るので、以下に３点だけ重要な点を記載します。

・導入した手法：gradient-based subword tokenization(GBST) module

・標準的な英語、非標準的な英語、多言語のいずれのタスクでも既存のモデルと同等かそれ以上のパフォーマンスを達成。

・同数のパラメータを持つモデルと比較して、メモリ効率性も高い。

以下のリンクより、元論文および解説動画もご参照ください。

了