はじめに
2020年3月30日夕方、「4月1日に政府が緊急事態宣言を出す」、「翌2日にロックダウン=都市封鎖を行う」という噂がインターネットで拡散しました。
日本におけるファクトチェックの普及活動を推進する FIJ(ファクトチェック・イニシアティブ)では、本件を信憑性の低い情報の一つとして取り上げています。
政府が4月1日に緊急事態宣言を出し、2日にロックダウンを行うー LINE などで拡散
この日の夕方の記者会見で、菅官房長官は明確にこの噂を否定しています1。
3月30日 17時58分: 官房長官 ネット上の“都市封鎖”情報「そうした事実ない」 | NHK ニュース
また、その日の夜には安倍総理大臣もこの噂を否定しているというニュースが報じられました。
3月30日 20時11分: 緊急事態宣言「“あさって宣言”はデマ」 安倍首相 | NHK ニュース
いったいこの噂はいつ、総理大臣や官房長官が看過できない程に広まったのか、興味を持ったため調べてみました。データとしてはニュースサイトと、拡散現象について検証し易く、且つ個人でも簡単に手に入れることのできる Twitter の検索 API を利用しています。
後述しますが、この噂の出所は LINE と推測されるため、Twiitter とその他公に公開されているデータのみを用いたこの検証は本質の一部しか捉えることはできません。加えてこの検証では、僕個人の考えや妄想も多分に含んでいる点を了承ください。
データセット
いつこの噂が広まったのか、その原因としては何が考えられるのか、これらを検証するためのデータとして Twitter の検索 API を主に利用しました。今回の件に関しては噂が仮に事実だったとして(緊急事態宣言の発令や都市封鎖が実施されるとして2)、近隣のスーパーなどでの買い占めが予想されることから身内・知り合いのみにこの噂を伝達したいという欲求が働き、Twitter ではなく LINE を積極的に利用することが予想されますが、LINE の情報は手に入れることができないためデータセットの候補からは除外しています。
2020年3月30日の17時58分の NHK ニュースでは菅官房長官が「都市封鎖」に、同日夜のニュースでは安倍総理大臣が「緊急事態宣言」に関する噂を否定していることから、3月30日を中心にこれら単語について言及しているツイートを集めました。
具体的には、2020/03/27 00:00〜2020/03/31 23:59の期間について、「ロックダウン OR 都市封鎖 OR 緊急事態宣言」の検索条件で Twitter API に問い合わせを行い、凡そ120万ツイートを得ました。以下に結果を示します3。横軸は時間、縦軸はツイートの数を表わしています。
また同データに対するローカル線形トレンドモデルの推定結果とその95%予測/信頼区間も一緒に示します。
See the Pen 「4月1日に緊急事態宣言」の拡散の推移について〜ツイート数の推移 by Tajima Junpei (@p-baleine) on CodePen.
推定結果において周期成分を取り除いたトレンド成分のグラフでは、3月28日と30日の夕方にかけて他の日には見れない上昇トレンドを確認することができます。
噂の出所
前述の上昇トレンドは、FIJ や各種ニュースサイトなどで注意換気されているチェーンメールが主な原因と推測されます。
「4月 1 日からロックダウンに入る」チェーンメールが『LINE』を中心に出回る。デマなので注意(篠原修司) - 個人 - Yahoo!ニュース
こちらの記事にある通り、当該のチェーンメールの出所は LINE と推測されます。LINE のデータにアクセスできないためチェーンメールの出自等を調べることはできません。また(Twitter における)「緊急事態宣言」のような単語の拡散現象の原因が、本当にこのチェーンメールだったのかを検証する術もありません。
その上で、以降、仮にチェーンメールが拡散現象の原因であったという前提の元ではなしをすすめます。
今回は、チェーンメールが拡散現象の原因だったという前提の元で、なぜ29日や31日ではなく30日に、わざわざ総理大臣がメディアで否定する事態となるまで、「緊急事態宣言」や「ロックダウン」という単語が拡散したのか、という点について調べてみました。
拡散の原因についての仮説
今回の拡散現象の原因としたチェーンメールは「デマ」と言われている通り、フェイクニュースの一種であると考えられます。
フェイクニュースを検証するにあたって、データを活用した社会課題解決に取り組む Public Data Lab が作成する、「A Field Guide to “Fake News” and Other Information Disorders」4を参考にしました。「A Field Guide to Fake News」では、伝統的な「いいね」やリツイート数を集計する方法とは別に、そのニュースが拡散した状況や拡散に関わったアクターに注目する方法が提案されています。これは、フェイクニュースを「誰が」「何の」目的のために拡散したのか、「誰が」そこに「どうして」関わったのか、など拡散の背景にある文脈に重点をおいている点で既存の手法と異なります。
今回の噂、「4月1日に緊急事態宣言」が、特定の個人や集団のイデオロギー、もしくは利害の絡んだいわゆるフェイクニュースなのかどうかは分かりませんが、拡散の背景にある文脈に着目することでより多角的な考察結果が期待されるため、この手法に則って検証してみます。
今回に限らず一般に、現時点の拡散具合は、より以降の時刻の拡散具合の原因になると考えられます。前掲の図におけるトレンドもそれをよく表しています。だけれど、29、31日は上昇トレンドが見られないこと、また上昇トレンドは確認できるものの30日が28日より上昇トレンドが顕著であることから、追加の原因の存在を想像できます。
今回はその原因として、当該時間付近でリツイート数の多かったツイートを仮定してみました。よりリツイートを獲得しているツイートは、その投稿時刻以降の拡散にプラス/マイナスの影響をより大きく及ぼすであろうという考えに基づいています。
この仮定を選択した理由としては、まず簡単に手に入るデータであるため、それから問題設定を簡素化できるためです。ニュースサイトや Facebook、それからウイルスの拡散状況など考え得る原因とその組合せは無数に存在しますが、それら全てを検証することはできません。一般にモデリングと言うと、自分の提案する仮説を最も的確に表現できる、最もシンプルな要素を用いるべきですが、今回は、要素(データ)がそもそも手に入るかどうかや、僕の計算機のリソースなど、本質とは外れた制約によってこの設定にしています。
検証結果
3月30日夕方付近のツイートでリツイート数の多かったものについて、それが「緊急事態宣言」や「都市封鎖」などの単語を含むツイートの拡散の原因となったのか検証します。
今回はもっともシンプルと考えられるモデルを検討しました。すなわち、前掲のツイート数を観測値とするローカル線形トレンドモデルに、外生変数として、一定数以上のリツイートを獲得したツイートがその時点で既にツイート済みか否かの二値を回帰項として加えてみました。(この回帰係数の推定は計算器のリソースの都合により最尤推定で行っています。)リツイート数の閾値としてはヒューリスティックに検討し、1,000 以上としています。以下に結果を示します。
See the Pen WNvBVXM by Tajima Junpei (@p-baleine) on CodePen.
グラフ上の丸がリツイート数 1,000 以上のツイート一つ一つを表しており、右の Y 軸は推定されたモデルの回帰係数に対応しています。丸の大きさは各ツイートのリツイート数に対応しています。また、グラフ上部には NHK NEWS WEB から独断で選んだ過去のニュース記事のタイトルを併記しています。
以下に、ローカルレベルモデルと、(前掲の)周期性を取り込んだローカル線形トレンドモデル、リツイート数 1,000 以上のツイートを外生変数として取り込んだモデルの AIC 5を示します。モデル選択の観点では、リツイート数 1,000 以上のツイートを外生変数として取り込んだモデルが最も良いモデルとなりました。
モデル | AIC |
---|---|
ローカルレベルモデル | 9334.294 |
ローカル線形トレンドモデル(周期性こみ) | 7640.617 |
ローカル線形トレンドモデル(周期性 + 外生変数) | 7491.854 |
上昇トレンドが見られた28日、30日共に回帰係数が正の値をとっているツイートが平時より多く存在している様子がわかります。しかし、この結果からでは何故28日、30日に上昇トレンドがあったのか、またなぜ30日の方が28日より顕著にそれが見られたのかは説明できませんでした。もしかしたら、回帰係数が正の値をとるツイートと、負の値をとるツイートの内容を比較することで、何かしらのヒントが得られるかもしれませんが、今回はそこまで踏みこんだ検証は行っていません。
また、このモデルはシンプルゆえに以下の問題を孕んでいると考えています:
- 外生変数の回帰係数を最尤推定で求めている。当該のリツイート数1,000以上のツイートが投稿された後ずっと同じ影響を及ぼすとは考えにくいため、時間と共に変化する時変変数として扱った方が自然だと思う
- リツイート数1,000以上のツイートを外生変数として扱っている。そもそもこれらツイートも、目的変数であるツイート数にある程度影響されて投稿されているはずなので、そこを全て無視してしまうのは乱暴すぎるかもしれない
また、今回はほぼ Twitter のデータのみを用いていますが、他の情報源を利用したモデル(例えば、NHK NEWS WEB の各記事を外生変数として取り込んだモデルなど)を検討することもできると思います。
おわりに
2020年3月30日の、「4月1日に政府が緊急事態宣言を出す」という噂について、これが拡散した理由を類似の単語を含むツイートから探ってみました。
個人的に本当にやりたかったこと、見てみたいことはこういったインターネットを介した噂やフェイクニュースが皆の心理に及ぼす作用を、自分なりに納得のいく形で捉えることができるようにすることです。マクロな視点だと「トレンド」が正にそれなのですが、「A Field Guide to “Fake News” and Other Information Disorders」にあるように、フェイクニュースの拡散に関わる人達の人間関係、利害関係、動機などを含めた視覚化に興味があります。
フェイクニュースに限らないと思いますが、家族や友人、自分が不利益を被る可能性のある情報は当然誰しも嬉しくなくて、だからこそこういったフェイクニュースは拡散すると、冷静な判断を鈍らせるきっかけになると思っています。あくまで僕の観測範囲のはなしですが、近所のスーパーは3月に入ってからも買い占めのような現象は見られませんでした。しかし、この日(3/30)の夕方に限っては普段と比べ日用品やお米の棚が品薄で、店舗内には買い占めに対する焦りのような空気を感じました。
また、今冷静になってくだんのチェーンメールの文面を見てみると、普段なら誰も騙されないような、教科書のようなチェーンメールであることが分かります。このメッセージの最後には、いかにもわざとらしく知人にメッセージを転送するよう指示が書かれており、これはチェーンメールの典型例と捉えることができます(Wikipedia:チェーンメール)6。
(もしこのメッセージを受け取っている方は文面を確認してみてください、他にも不思議な点がけっこうあります。)
にも関わらず、ネット上で噂が拡散していて、且つ例えば近所のスーパーが普段より品薄だったりすると、もしかしたら騙されてしまう人もいるかもしれません(僕は半分くらい騙されました)
多分ここまで読んでいただければ分かるかと思いますが、僕は時系列分析もフェイクニュースも完全に門外漢です。もし間違っているところがあれば、ご指摘頂けると本当にうれしいです。ただ素人なりに、身の危険を感じるような状況で人がインターネットを介して間接的に繋ったときに、集団としての人がどういった行動をとるのか興味があり、今回勉強もかねてこの件に取り組んでみました。
実際にやってみて、情報収集・推論共に想定以上に手元の計算機のリソースを要したため、少しのモデルしか検証できませんでした。他の作業(ネット潜ったりとか Emacs 弄ったりとかたまに仕事したりとか)が出来なくなってしまうので、推論などリソースを喰うタスクはクラウドでやりたいと思うけれど、先立つものが…
また興味が湧くテーマがあったら、それから、元気とリソース(時間はあるので の方)もあったら挑戦してみたいと思います。
参考文献
この検証を行うにあたって、以下を参考にしました:
- 経済・ファイナンスデータの計量時系列分析
- 時系列分析と状態空間モデルの基礎―RとStanで学ぶ理論と実装―
- A Field Guide to “Fake News” and Other Information Disorders
-
但し FIJ のサイトにも 記載 のある通り、これら記事も100%正しいことを保証されたものではなく、従ってこの記事で取り上げる「デマ」が100%「デマ」であることも保証はされません。 ↩
-
余談ですが、僕も含め特に都内在住の人は緊急事態宣言と都市封鎖を一緒くたに捉えがちと感じます ↩
-
モデルの推定は statsmodels で行いました。グラフは Observable で作成し、CodePen を利用して埋め込んでいます。 ↩
-
ダウンロードできる PDF は全体的に Illustrator や InDesign を用いて作成されているためか、手元の環境ではコピー・アンド・ペーストができなくてメモを取るのに難儀しました。Github にソースが公開されているため、メモをとる際にはこちらを利用すると良いかもしれません https://github.com/PublicDataLab/fake-news-field-guide ↩
-
https://ja.wikipedia.org/wiki/%E8%B5%A4%E6%B1%A0%E6%83%85%E5%A0%B1%E9%87%8F%E8%A6%8F%E6%BA%96 ↩
-
これは僕の妄想ですが、どこかのタイミングで「大切な人に回して下さい」の一文を付け加えた誰かは(わざとらしい文面にも拘らず)思った以上に広まってしまい、苦笑いしているのではないかと思います ↩