心理的側面を考慮に入れた含意関係認識
解決したいこと
私は心理的な側面を考慮に入れた含意関係認識のためのモデルを構築出来たらなと考えています。SNSなどのテキストデータの分析の際に心理的側面を考慮に入れた含意関係認識の技術があれば、より正確な世論の調査や世間の反応の調査などが自動で行えると考えたためです。以下にその構想と問題点を書きます。構想を読んで問題点を解決してくれたらうれしいです。
では以下に構想を示します。
<構想>
意味的に含意していても心理的な側面を考慮に入れた場合含意していないケースやその真逆と言えるケースは数多く存在します。具体的には以下のような例を考えています。
例1-1)
前提文:
あなたのことなんて大嫌い
仮定文:
私はあの人が苦手だな
→含意しているようで真逆では?前提文は「好きの裏返し」かも、仮定文は「嫌いの気持ちを少しオブラートにつつんでいる」のでは?
例1-2)
前提文:
あなたのことなんて大嫌い
仮定文:
あなたのことを愛している
→一見含意していないようだが、もし前提文が「好きの裏返し」とするなら、含意関係にあるといえる。
例2)
前提文:
あそこであの決断は流石にあり得ない
仮定文:
あまり望ましい決断ではなかったかもしれない
→前提文は完全なる批判だが、仮定文は擁護の意思が見られる
例2-2)
前提文:
あそこであの決断は流石にあり得ない
仮定文:
よくあの場面であんな決断できたなあ
→仮定文は前後の文脈や状況によって皮肉と捉えることも、称賛と捉えることもできる。もし前後の文脈から皮肉であることが予測された場合、これは含意関係にあることになる。
いずれも前後の文脈や状況に依存する部分があるかもしれませんが、上に示した例のようなケースも実際に存在していると思います。そんな中で私の知る限りの従来の手法ではこれらは「意味的な側面(キーワード)など」から含意関係が推測され、上に示した例とは逆の判定が下されることが想定できます。ここで、私は心理的な側面を考慮に入れた含意関係モデルを構築出来たらなと考えました。
方針:
ユーザの投稿中に現れるスタイルの類似性を捉えた文ベクトルを非常にシンプルな手法で学習させたStyleSimCSEを活用します。これによってより高い精度での各投稿の感情の分析を行い、これらのデータを元にして、前提文に対して仮定文の心理状態が同傾向を示しているかどうかを判断できるようにします。
発生している問題
・そもそも上の構想はまともなものになっているか。
・どのようなデータセットを用いれば良いか。
・より具体的な手順や手法が知りたい。
※だいぶ抽象的な内容で、重要な手法の部分の詳細が抜けていると思いますが、私の考えていることが現実的に考えてどう思うかについて教えてほしいです。また、もし可能であれば、下のことを実現させるためのより具体的な手法を教えてください。もし下の内容があまり現実的でなかったり、微妙に感じたりした場合は、下の構想をなるべくくみ取った代替案などについてまで教えていただけたら本当に助かります。