LoginSignup
9
11

More than 3 years have passed since last update.

[形態素解析] 「仮定縮約1」とは?MeCab・IPADICの品詞分類を理解しよう

Last updated at Posted at 2021-01-13

MeCabで多くの人が用いるIPADICでは総勢1316の分類(ID)が定義されています1。その中には「動詞,自立,*,*,五段・ラ行特殊,仮定縮約1,*」のように、パッと見ただけではどんな単語が該当するのかわからないような物も多いです。

そこで「ipadic version 2.7.0 ユーザーズマニュアル」という品詞体系の解説を参考に、実際の解析結果などと付き合わせつつ、品詞の分類全体を眺めていきます。

なお、記事内で示す解析結果はNEologdを用いています。これはpythonで次のようなコードで出力しています。

node = mecab.parseToNode(text).next

while node:
    print(node.surface, node.lcAttr, node.rcAttr, node.feature)
    node = node.next

BOS/EOS: 0

文章の始端(Beginning of sentence)と終端(End of sentence)を表します。BOSとの名前ですが、EOSの品詞IDも0です。始端と終端は品詞上区別されません。

間投詞: 1

「[名詞-接尾]や,[助詞-終助詞]としにくいもの」と定義されていますが、見つけたことがありません。

フィラー: 2

「話し言葉で起こるあいずちや挿入的な音声ことば」とされています。「あのー」「えーと」のように言い淀みの言葉はフィラーにあたります。相槌ならば「へえ」などもフィラーに分類されそうですが、これは感動詞に分類されていました。

実際、感動詞とよく解析が混ざります。例えば

>どうも、えっとそれは

えっ 3 3 感動詞,*,*,*,*,*,えっ,エッ,エッ
と 164 164 助詞,格助詞,引用,*,*,*,と,ト,ト

>どうも、ええとそれは

え 3 3 感動詞,*,*,*,*,*,え,エ,エ
えと 2 2 フィラー,*,*,*,*,*,えと,エト,エト

>どうも、えーとそれは

えーと 2 2 フィラー,*,*,*,*,*,えーと,エート,エート

のような具合です。

感動詞: 3

フィラーとは違い、「感動詞.あいさつなど」とされています。「こんにちは」「じゃあ」など、フィラーよりも意味の認められるものが多いです。

記号: 4~9

  • アルファベットはローマ字やキリル文字やギリシャ文字です。
  • 括弧開です。
  • 括弧閉です。
  • 句点.です。
  • 空白 です。
  • 読点,です。

形容詞: 10~146

形容詞は自立,接尾,非自立の3つに大別されます。

  • 自立はそれ単独で形容詞として用いられるもの(例:嬉しい、早い)です。
  • 接尾は体言について形容詞を新たに生成するもの(例:埃っぽい、嫌味ったらしい)です。
  • 非自立は専ら活用語に接続するもの(例:認めがたい、考えづらい、返してほしい)です。「て」がついても良いようです。

さらにそれぞれ、「アウオ段」及び「イ段」に分かれます。これらは学校文法で言う「ク活用」「シク活用」に対応するものです。

活用形として「ガル接続」「仮定形」「仮定縮約1」「仮定縮約2」「基本形」「体言接続」「文語基本形」「未然ウ接続」「未然ヌ接続」「命令e」「連用ゴザイ接続」「連用タ接続」「連用テ接続」があります。

  • ガル接続は「嬉しがる」のように「がる」に接続する形です。アウオ段の形容詞では語幹、イ段の形容詞では「語幹+シ」に一致します。「すぎる」「悲しさ」「虚しそう」のような例でもガル接続の活用形が用いられます。
  • 仮定形は「美味しければ」のような形です。
  • 仮定縮約1は仮定形で「ば」が形容詞に合わさって縮約され、「美味しけりゃ」となる形です。
  • 仮定縮約2はさらに縮約が進み、「美味しきゃ」となる形です。アウオ段の形容詞では「語幹+きゃ」、イ段の形容詞では「語幹+しきゃ」の形をとります。
  • 基本形はそのままの形です。口語の終止形に一致します。
  • 体言接続は文語の連体形です。「ウザき人」のような形です。
  • 文語基本形は文語の終止形です。「いとエモし。」のような形です。
  • 未然ウ接続は「高かろう」のように助動詞「う」に接続する形です。
  • 未然ヌ接続は「高からぬ」のように助動詞「ぬ」「ん」「ず」などに接続する形です。
  • 命令eは「幸多かれ」のように最後がエ段で終わる命令形です。
  • 連用ゴザイ接続は「愛しうございます」のように「ござる」などに接続する形です。「苦しゅうない」のような形で助動詞「ない」に接続する場合も連用ゴザイ接続が用いられます。
  • 連用タ接続は「うるさかった」のように助動詞「た」などに接続する形です。
  • 連用テ接続は「女々しくて」のように助詞「て」などに接続する形です。「うるさくする」のように動詞に接続する際、「芳しくない」のように助動詞「ない」に接続する場合も同様に連用テ接続の活用形が用いられます。

少し気になっているのは「ウゼえ」のような「エ段変形」の形容詞が入る枠がないことですが、今のところ他品詞との接続上基本形と違いはないので、基本形として扱えばいいのだと思います。
が、IPADICにもNEologdにもこの形の形容詞は入っていないため、

早 11 11 形容詞,自立,*,*,形容詞・アウオ段,ガル接続,早い,ハヤ,ハヤ
え 2 2 フィラー,*,*,*,*,*,え,エ,エ

のようなイマイチな解析結果になります。

助詞: 147~368

助詞は「格助詞」「終助詞」「接続助詞」「特殊」「副詞化」「副助詞」「並立助詞」「連体化」と大きく分類されています。このうち格助詞はさらに「一般」「引用」「連語」として細分されます。
さらに、ほぼ全ての助詞が1つの語彙で1つの品詞となっています。これは助詞の接続上の特徴が多様であることが原因していそうです。

助動詞: 369~554

助動詞も同様に全ての助動詞が1つの語彙で1つの品詞となります。さらに助動詞の場合は活用形があるため、各活用形で別の品詞IDが割り振られています。

接続詞: 555,556

「しかし」「故に」などです。なぜか「及び」のみ単独で556番が与えられているのですが、不思議です。

接頭詞: 557~560

「形容詞接続」「数接続」「動詞接続」「名詞接続」の四種類があります。

  • 形容詞接続は「クソ汚い」の「クソ」のように形容詞について意味を付け加える接頭辞です。
  • 数接続は「2回」のように数詞について意味を付け加える接頭辞です。
  • 動詞接続は「ぶち殺す」の「ぶち」のように動詞について意味を付け加える接頭辞です。
  • 名詞接続は「発見」のように名詞について意味を付け加える接頭辞です。

気になったのは「クソ」「超」のように比較的広い品詞に接続できる接頭辞の行き場がなさそうなことですが、どうにかなっているのだと思います。

動詞: 561~1280

動詞は形容詞同様「自立」「接尾」「非自立」で大別され、活用の種類として「カ変」「サ変」「ラ変」「一段」「下二段」「五段」「四段」「上二段」があります。
このうちさらに細分され、

  • 「下二段」は「カ行、ガ行、ダ行、ハ行、マ行」及び「得」
  • 「五段」は「カ行(イ音便/促音便)、ガ行、サ行、タ行、ナ行、バ行、マ行、ラ行、ラ行特殊、ワ行(ウ音便/促音便)」
  • 「四段」は「サ行、タ行、ハ行、バ行」
  • 「上二段」は「ダ行、バ行」

形容詞に比べてかなり複雑ですね。

このうち「上二段」「下二段」「ラ変」「四段」は学校文法では文語でのみ存在する活用で、口語に対応する活用形(例えば四段→五段)がある場合はそちらが優先される傾向があります。

まず、一般的に次の活用形が存在します。

  • 仮定形は「走れば」のような「ば」に接続する形です。
  • 基本形は「走る」のような形です。学校文法の終止形・連体形はともにこれに含まれます。連体形が終止形と異なる動詞では体言接続という形で連体形が定義されます。
  • 未然形は「走らない」のような形です。

個別の事情は活用の種類ごとに確認します。

カ変動詞

日本語においてカ変動詞は「来る」及びその派生動詞だけです。活用形としては以下の通りです。

  • 仮定形は「来れば」のような形です。
  • 仮定縮約1は「来りゃいい」のような形です。
  • 基本形は「こっちに来る」のような形です。
  • 体言接続特殊は「今日来んの?」のような「の」に接続する口語の形です。
  • 体言接続特殊2は「今日の?」のような形です。聞いたことはありませんが定義上あります。
  • 未然ウ接続は「また来よう」のような形です。
  • 未然形は「まだない」のような形です。読みは「こない」となります(一部地域では「きない」と発音します)。
  • 命令iは「こっち来い」のような形です。読みは「こい」となります。
  • 命令yoは「こっちに来よ」のような形です。読みは「こよ」となります。口語ではあまり使いませんが、文語では「来よこよ」が標準的な形です。
  • 連用形は「ます」のような形です。読みは「きます」となります。

サ変動詞

サ変動詞は「サ変・−スル」「サ変・−ズル」「サ変・スル」で分かれます。要するに「スル」とその派生動詞のみですが、非常に複雑な接続をします。

例えば「反す」を考えましょう。体言に接続する場合「定説に反する主張」「定説に反す主張」はどちらも可能ですし、否定する場合「定説に反さない」「定説に反しない」はどちらも可能です2。注意深く考えないと何が何だかさっぱりわかりません。

五段化と上一段化

サ変動詞が混沌としている原因の一つはこの「サ変動詞の五段化上一段化」です。意識しておくと理解がしやすくなります。

例えば「愛す」は「愛+す(文語サ変動詞)」という形成です。「す」を保ったまま「ず」に接続させれば「愛せず」となるはずですが、実際には「愛さず」形が主に利用されます。このようにサ変動詞が五段活用の動詞として再認識されていくのがサ変動詞の五段化です。

五段動詞では可能動詞という形があるため、「愛す」からは「愛せる」が生じます。このため現代では「愛せず」形は可能動詞「愛せる」の活用形と捉えられます。一方「損す」はこうはならず、「損せず」が「損できない」という意味にはなりません。このような語は五段化していません。

「愛する」という形もあります。これは「愛+する(口語サ変動詞)」という形成です。「する」を保ったまま「ない」に接続する場合は「愛しない」となります。この場合では「愛しない」よりも「愛さない」が優勢なような気がしますが、例えば「反しない」と「反さない」や「関さない」と「関しない」ではどうでしょうか。この辺りは語彙ごとにばらつきがありますし、地域や年齢によっても変わるようです。

気をつけなければならないのは、「名詞・サ変可能」という品詞があることです。見分け方の一つとしては「間に『を』」を入れられるか、でしょうか。ですから「一刀両断(を)する」は1つのサ変動詞ではなく「一刀両断」と「する」で分けて扱います。先に挙げた「損する」も実のところ怪しいと思うのですが・・・。

また「信ずる」は「信+ずる」という形成です。ところが現代では「信じる」が優勢です。このように、「ーズル」形の動詞の多くが現代では「ージル」形に置き換わっています。この形になると活用は上一段型になります。このような現象をサ変動詞の上一段化といいます。「信ずる」は上一段階していませんが、「信じる」は上一段化していることになります。

五段化していない「ースル」動詞が「サ変・−スル」であり、一段化していない「ーズル」動詞が「左辺・ーズル」に入ります。「左辺・スル」は「する」そのものです。「サ変・−スル」「左辺・ーズル」では、連用形の形は五段化・上一段化したものと一致するため、連用形がありません。

サ変・−スル

含まれるのは「愛する」「反する」などの動詞です。

  • 仮定形は「愛すればいい」のような形です。
  • 仮定縮約1は「愛すりゃいい」のような形です。
  • 基本形は「これに反する」のような形です。
  • 文語基本形は「汝を愛す」のような形です。文語における終止形に一致します。
  • 未然ウ接続は「また愛しよう」のような形です。ただこの場合五段動詞として捉えられた「愛す」優先される印象です。
  • 未然レル接続は「愛せらる」のような形です。ただこの場合五段動詞として捉えられた「愛す」が可能動詞化した「愛せる」が優先される印象です。
  • 未然形は「法には反しない」のような形です。
  • 命令roは「これに反しろ」のような形です。
  • 命令yoは「汝隣人を愛せよ」のような形です。

サ変・−ズル

含まれるのは「信ずる」「減ずる」「命ずる」などの動詞です。

  • 仮定形は「信ずれば道は開ける」のような形です。
  • 仮定縮約1は「信ずりゃ道は開ける」のような形です。
  • 基本形は「汝を信ずる」のような形です。
  • 文語基本形は「ここから三を減ず」のような形です。文語における終止形に一致します。
  • 未然ウ接続は「また命じよう」のような形です。ただ、「ーズル」動詞が一段化して「ージル」動詞となったものが優先されるため、実際にこの形が見られることは滅多にないと思います。
  • 未然形は「まだ信じない」のような形です。やはりこの形が解析で出てくることは滅多にないと思います。
  • 命令roは「これに命じろ」のような形です。
  • 命令yoは「信ぜよ」のような形です。

サ変・スル

含まれるのは「する」そのものです。

  • 仮定形は「こうすれば良い」のような形です。
  • 仮定縮約1は「こうすりゃ良い」のような形です。
  • 基本形は「ゲームをする」のような形です。
  • 体言接続特殊は「ゲームすんの?」のように「の」に接続する口語の形です。
  • 体言接続特殊2は「今日の?」のような形です。
  • 文語基本形は「このように」のような形です。文語における終止形に一致します。
  • 未然ウ接続は「そうしよう」のような形です。
  • 未然ヌ接続は「そうはぬ」のような形です。
  • 未然レル接続は「暴行れる」のような形です。
  • 未然形は「そうない」のような形です。
  • 命令iは「掃除せい」のような形です。
  • 命令roは「こうしろ」のような形です。
  • 命令yoは「ああせよ」のような形です。
  • 連用形は「こうます」のような形です。

ラ変動詞

いわゆる「あり・おり・はべり・いまそかり」が該当します。また派生する「然り(さり、しかり)」などラ変動詞です。「仮定形」「基本形」「体言接続」「未然形」「命令e」「連用形」があります。
学校文法ではラ変はすでに五段化したものとされており、現代語の形態素解析には関係ないように思われますが、実際には文語表現として残っています。例えば

  • 未然形は「隙あらば」「幸あらんことを」「然らば」などで用いられます。
  • 連用形は「ありし日の」「結論ありきの」などで用いられます。
  • 基本形は「逆もまた然り」などで用いられます。
  • 体言接続は「敵も然る者」などで用いられます。

ただ、そもそも「然り(さり、しかり)」は登録されていなかったり、ほとんどの場合現代語のラ行五段動詞「ある」が優先されたりと、解析はあまりうまくいかないようです3

>隙あらば

あら 406 406 助動詞,*,*,*,五段・ラ行アル,未然形,ある,アラ,アラ
ば 318 318 助詞,接続助詞,*,*,*,*,ば,バ,バ

>幸あらんことを
あら 780 780 動詞,自立,*,*,五段・ラ行,未然形,ある,アラ,アラ
ん 515 515 助動詞,*,*,*,不変化型,基本形,ん,ン,ン

>然らば
然 1281 1281 副詞,一般,*,*,*,*,然,シカ,シカ
ら 1298 1298 名詞,接尾,一般,*,*,*,ら,ラ,ラ
ば 318 318 助詞,接続助詞,*,*,*,*,ば,バ,バ

>ありし日の
あり 788 788 動詞,自立,*,*,五段・ラ行,連用形,ある,アリ,アリ
し 517 517 助動詞,*,*,*,文語・キ,体言接続,き,シ,シ

>結論ありきの
あり 788 788 動詞,自立,*,*,五段・ラ行,連用形,ある,アリ,アリ
き 516 516 助動詞,*,*,*,文語・キ,基本形,き,キ,キ

>逆もまた然り
然 1281 1281 副詞,一般,*,*,*,*,然,シカ,シカ
り 546 546 助動詞,*,*,*,文語・リ,基本形,り,リ,リ

>敵も然る者
然 1281 1281 副詞,一般,*,*,*,*,然,シカ,シカ
る 547 547 助動詞,*,*,*,文語・リ,体言接続,り,ル,ル

一段動詞

「上一段動詞」「下一段動詞」です。「食べる」「枯れる」「着る」「見る」「感じる」などが当たります。ただし「くれる」「得る」は例外のため単体で品詞化されています。

通常の一段動詞では次のようになります。

  • 仮定形は「食べれば」のような形です。
  • 仮定縮約1は「見りゃわかる」のような形です。
  • 基本形は「花が枯れる」のような形です。
  • 体言接続特殊は「これ食べんの?」のような「の」に接続する口語の形です。
  • 未然ウ接続は「これ着よう」のような形です。
  • 未然形は「そうは感じない」のような形です。
  • 命令roは「さっさと着ろ」のような形です。
  • 命令yoは「これを見よ」のような形です。
  • 連用形は「食べてます」のような形です。

「くれる」では次の違いがあります。

  • 命令eは「これをくれ」のような形です。これは「くれろ」の「ろ」が落ちた形です。
  • 体言接続特殊が消えます。
  • 未然特殊が代わりに増えます。これは「やめてくんない?(=やめてくれない?)」のような形に接続するもので、「揺んないで」とは言わないように、他の上一段動詞では見られない形です。

ただ、体言接続特殊である「どうしてくれんの?」のような形は普通にありますから、これが無いのは少々不可解だなあと思っています。

また「得る」については以下の2つのみあります。

  • 仮定形は「ありえれば」のような形です。
  • 基本形は「ありえる」のような形です。 これらは次の「下二段」でカバーできない部分を補うために追加されていると考えればよさそうです。

下二段動詞

前述の通り「カ行、ガ行、ダ行、ハ行、マ行」及び「得」に分けられます。

下二段動詞は「得」を除いては「仮定形」「基本形」「体言接続」「未然形」「命令yo」「連用形」の活用形があります。例えば下二段動詞「逃ぐ」を考えると、

  • 仮定形は「逃ぐれば」のような形です。文語文法では「已然形」と呼ばれるものですが、こちらを仮定形にしています。
  • 基本形は「逃ぐ」のような形です。
  • 体言接続は「逃ぐる者あり」のような形です。
  • 未然形は「逃げない」のような形です。
  • 命令yoは「逃げよ」のような形です。
  • 連用形は「逃げにけり」のような形です。

なお、「得」の場合は未然形未然ウ接続が別に定義されています。この未然ウ接続は「得よう」のように、「よ」が含まれます。学校文法の解釈ではこれは未然形「得(え)」に不変化型の助動詞「よう」がついたものと見なすものだと思っていたのですが、IPADICはそうではないようです。

そうなってくると不思議なのは「得」以外の下二段動詞に未然ウ接続が定義されていないことです。下二段動詞は文語において現れる形で、口語助動詞「う」とは原理的に接続し得ない、最悪命令yoで代替すれば良い、と考えれば、それはそれで良いような気もしますが、実際の事情が少し気になります。

五段動詞

前述の通り「カ行(イ音便/促音便/促音便ユク)、ガ行、サ行、タ行、ナ行、バ行、マ行、ラ行、ラ行特殊、ワ行(ウ音便/促音便)」と分かれます。

  • カ行五段動詞では例外的に「行く」のみ促音便で活用します。このためカ行はイ音便と促音便に分けられています。さらに「ユク(行く)」の特殊性のために「促音便ユク」という独立した項目があります。
  • ワ行も同様に「言う」「買う」などの例では促音便ですが、「問う」ではウ音便です。このためワ行はウ音便と促音便で分かれます。
  • ラ行とラ行特殊の違いは「ます」への接続の形(連用形)です。ラ行では「走ります」の形が登録されていますが、ラ行特殊では「いらっしゃいます」のようにイ音便の形が連用形として登録されています4

なお、言うまでもありませんが「言う」のような「う」で終わる五段動詞はワ行です。

まず共通する活用形は次のようになっています。ほとんど教科書通りですね。

  • 仮定形は「殴れば」のように「ば」に接続するときの形です。
  • 基本形は「君と歩く」のような形です。
  • 未然ウ接続は「買おう」のような形です。
  • 未然形は「脱がないで」のような形です。
  • 命令eは「寄越せ!!」のような形です。
  • 連用形は「喜びます」のような形です。

次に個別の注意が必要な活用形です。

  • 仮定縮約1は「行きゃいいんでしょ」のように「仮定形+ば」が縮約された形です。この活用形はワ行の動詞にはありません。「言う」でこれをやろうとすると「言やいいんでしょ」のようになるのでしょうか。口語では若干聞く気もしますが、IPADICでは定義されていません。
  • 連用タ接続は音便によって変わります。
    • カ行イ音便、ガ行では「書いた」「脱いだ」のように「い」となります。
    • カ行促音便、タ行、ラ行、ラ行特殊、ワ行促音便では「放った」「怒った」のように「っ」となります。
    • ナ行、バ行、マ行では「読んだ」「呼んだ」のように「ん」となります。
    • ワ行ウ音便では「問うた」のように「う」となります。
    • カ行促音便ユク、サ行では存在しません。「ユク」は「タ」に接続できませんし、サ行では連用形と一致するからです。
  • 体言接続特殊はラ行、ラ行特殊のみに存在し、「怒んの?」のような形になります。この形は他の動詞では存在しません。「言んの?」とか「騒んの?」とかは破格ですね。
  • 体言接続特殊2体言接続特殊の「ん」が脱落したものです。聞いたことはないのですが、「取の?(=取んの?=取るの?)」のような接続だそうです。実際に解析すると確かにそのようです。
>取の
取 776 776 動詞,自立,*,*,五段・ラ行,体言接続特殊2,取る,ト,ト
の 282 282 助詞,終助詞,*,*,*,*,の,ノ,ノ
  • 未然特殊はラ行、ラ行特殊のみに存在し、「走んないでください」のような形をとります。これもラ行以外ではあり得ません。
  • 命令iはラ行特殊のみに存在し、「こっちにいらっしゃい💢」「来なさい」のような形をとります。ただし「いらっしゃい」については名詞として登録されているため命令iになりませんでした。

余談

ナ行五段活用の動詞は「死ぬ」のみなのですが、近年ネットスラングの影響で「タヒぬ(=タヒぬ=死ぬ)」がナ行五段活用動詞の仲間入りを果たそうとしています(本当か?)

ところで「タヒぬ」はしばしば「タヒんないでくれ(=死なないでくれ)」のように、上で言うところの未然特殊形で活用されるのですが、これは「死ぬ」の単純な置き換えではありません。「死んないで」は通じないからです。つまり、「タヒぬ」は「死ぬ」から派生して独自の活用形を手にしていることになります。

もう少し「タヒんないでくれ」が拡大していくようなら、「カ行促音便ユク」のように「タヒぬ」が独立して「ナ行タヒヌ」になるかもしれませんね(本当か??)

四段動詞

四段動詞は文語での五段動詞に対応します。「言ふ」などがこれに当たりますが、登録はないようです。「サ行、タ行、ハ行、バ行」の4つがありますが、活用形はどれも「仮定形」「基本形」「未然形」「命令e」「連用形」の六種類です。形も教科書通りです。
「話す」「呼ぶ」などの動詞は「四段活用」としての解釈の可能性を持ちますが、今のところは五段活用が優先されます。

上二段動詞

「ダ行、バ行」のみあり、「閉づ」などがこれに当たるはずですが、登録はないようです。「現代基本形」のような分類はよくわかりませんでした。識者の方教えてください。

副詞: 1281,1282

「一般」と「助詞類接続」の2つです。

  • 一般は「めらめら燃える」「やはりそうだ」「決して許さない」のようなものです。
  • 助詞類接続は「すぐには不可能」「何でも」のように、「の」「に」などの助詞や「する」などが接続できる副詞です。

この分類だと「きらきら」は助詞類接続でもよさそうですが、IPADICでは一般です。個人的には若干未整理な印象を受けます。

名詞: 1281~1314

名詞は「接尾」であるもの、そうでないもの次のように細分されます。

  • 一般は後述する他の分類に入らないもの全般です。例えば「名詞」です。
  • サ変接続は「主張する」のように「する」に接続できる名詞です。
  • ナイ形容詞語幹は「問題ない」「面目ない」のように「ない」がついてそれが存在しないことを示す形容詞にできる名詞です。
  • 引用文字列は「単語への分割が不可能なもの,および,ことわざ,漢詩,方言,英語などを表すタグ として「名詞 引用文字列」が用意されている」という理由によって設けられている分類です。ただしIPADICでは「いわく」のみがこの分類に入れられているようです。
  • 形容動詞語幹は「貴重な」のように、形容動詞の語幹となれる名詞です。
  • 固有名詞はいわゆる固有名詞ですが、さらに細分化されています。
    • 一般は後述する他の分類に入らないもの全般です。例えば「iPhone」はこの分類です。
    • 人名は人の名前に関わるものです。さらに「姓・名・一般」の三つに細分されます。
    • 組織は会社や団体名です。「トヨタ」はこの分類です。
    • 地域は地名です。さらに「国・一般」の二つに細分されます。
  • は数値です。「42」などです。
  • 接続詞的は接続詞のように用いられる名詞です。「風神VS雷神」のようなものです。名詞なのか少し疑問が残ります。
  • 接尾は接尾辞として働く名詞です。さらに細分されます。
    • 一般は後述する他の分類に入らないもの全般です。
    • サ変接続は「現実する」のように「する」に接続できる名詞を作る接尾辞です。
    • 形容動詞語幹は「現実な」のように形容動詞の語幹となれる名詞を作る接尾辞です。
    • 助数詞は「一」「二十二」のような接尾辞です。
    • 助動詞語幹は「美味しそう」の「そう」です。「そうだ」で助動詞とする立場もありますが、ここでは「そう」が独立しています。
    • 人名は人名につく接尾辞です。「花子」「太郎さん」などがあります。
    • 地域は「〇〇」のように、地名につく接尾辞です。
    • 特殊は「美し」のように、特定の品詞と結びついて名詞を作る接尾辞です。
    • 副詞可能は「三日」のように副詞として用いられやすい名詞を作る接尾辞です。
  • 代名詞は「一般」と「縮約」に分かれます。前者は「私」「あれ」など、後者は「ありゃ(=あれは)」のようなものです。ただ「ありゃ」は感動詞と解析されがちです。
  • 動詞非自立的は「教えてちょうだい」「行ってごらん」のように名詞でありながら「て」に接続し、動詞のように働くものです。
  • 特殊・助動詞語幹は接尾辞でない場合の「そう」です。「聞いたそうだよ」の「そう」はこちらで判定されます。
  • 非自立は単独で意味の弱い名詞です。さらに細分されます。
    • 一般はこれ以外の分類に当てはまらないもの全てです。形式名詞なども当てはまります。「そのには」「あのの」などが当たります。
    • 形容動詞語幹は「人間みたいなロボット」などの形容動詞を作るものです。
    • 助動詞語幹は「美味しいようだね」などです。「ようだ」も助動詞とする立場もありますが、ここでは「よう」が独立しています。
    • 副詞可能は「言った矢先」など、副詞として用いられやすい非自立な名詞です。
  • 副詞可能は「半分食べた」 「絶対行きたい」など副詞としても用いることのできる名詞です。

連体詞: 1315

大きな桃」のように専ら体言を修飾し、動詞を修飾できない品詞です。

まとめ

  • 分類はめちゃくちゃ複雑
  • 日本語なんもわからん

参考資料


  1. IPADICのleft-id.defを参照しています。私の環境ではmecab-ipadic/2.7.0-20070801/lib/mecab/dic/ipadic/left-id.defの位置にあります。文字コードがutf8ではないですが、nkfなどで適宜読んでください。あるいはgithubならすぐに読むことができます。 

  2. 例えば「トランプ氏のアカウント停止 表現の自由に反しない? - アメリカ大統領選挙2020:朝日新聞デジタル」と「総務相「放送法に反さない」:朝日新聞デジタル」のように、新聞社のような文体に厳しい環境でも統一されていないことが伺えます。 

  3. ラ変動詞と五段動詞はほとんどの活用形で一致しますから、形から明確に「ラ変か五段か」を判断できるケースは「文句あんの?」「あろうことか」などごく僅かです。「ありし日の」を通常ラ変連用形で解釈するのは、「し(き)」が文語助動詞であるところに依る部分が大きいのですが、口語助動詞として「し(き)」を認めるならば五段連用形で解釈しても間違っているとは言い切れない面もあります。ただ「ラ変動詞」という分類が存在するにもかかわらず利用出来ていないのは事実です。 

  4. 連用中止形「〇〇さんがいらっしゃり、お話を伺うことができました」のような語形もある程度一般的に用いられているのですが、解析は失敗します。 

9
11
4

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
9
11