前書き
この記事で取り上げるツイートは投稿者の方の了承を得たわけではありません。User IDなど個人を特定する情報を含まないように配慮したつもりですが、不快に感じた方がいらっしゃったら迅速に記事の修正や非公開などの対応をします。この点ご了承ください。
持論:「人は寒すぎるとサムスになる!」
みなさんは、寒すぎると何になりますか?**ぼくは寒すぎるとサムスになります。**今年もサムスになりました。
以前Twitterでアンケートを取ってみたら、サムスになる方が多いようでした。
しかし65票しかない4択アンケートの投票結果だけで判断するのは良くないです。そこでTwitterの約7400件の投稿から、
「人は寒すぎると何になるのか?」
についてがんばって調べました。以下丁寧語やめます。
調査方法
1.検索クエリ
Twitterで**「寒すぎて になった」**で検索して、データを集めた。この際以下の条件をつけた。
- リツイートは含まない
- 事実でないものは含まない
「寒すぎて~になりそう」「寒すぎて~になる」などのツイートも多数見えけられたが、これらは実際になったことの報告ではないので信ぴょう性に欠ける。今回は過去形で実際に"へんしん"したと思われる「寒すぎて~になった」のみを扱うことにした。
2.集計期間
Twitter APIの都合で過去一週間分しか取れなかったので、2回にわけてツイートを集めた。
- 期間1:2020/12/07 18:30~2020/12/16 10:00 → 5040 tweets
- 期間2:2020/12/24 21:00~2021/01/01 22:00 → 2371 tweets
空白の期間ができてしまったが、合計7411 tweets 分のCSVファイルを作成した。
3.前処理
記事を公開するにあたって、個人情報を省いたデータを作成することにした。具体的には以下の二つを行った。
- 取得したデータから不要なカラムを除去する
- 投稿からユーザーIDを除去する
df = pd.read_csv("data.csv")
_drop_list = list(set(df.columns) - set(('created_at', 'text')))
df.drop(columns=_drop_list, inplace=True)
def _remove_reply(x):
return re.sub("@.+ ", "", x)
df.text = df.text.map(_remove_reply)
上のコードは一部抜粋したものなので、このままでは動かない。GitHubではpreprocessing.py
で行っている。
またTwitterの検索結果は OR での結果のため、「寒すぎて~になった」以外の表現や文章も含まれている。そこで正規表現を用いて必要な部分のみ抜き出すことにした。ついでに不要そうな文字も除去しておく。
matches = []
pattern = '寒すぎて.+になった'
prog = re.compile(pattern)
ignore_chars = [" ", " ", ",", "、"] # 不要そうな文字
for text in text_list:
for char in ignore_chars:
text = text.replace(char, "")
result = prog.match(text)
if result:
matches.append(result.group(0))
words = [m.replace("寒すぎて", "").replace("になった", "") for m in matches]
ignore_chars
の文字を無視することで、「寒すぎて、~になった」「寒すぎて ~ になった」などの表記ゆれに対応した。
4.集計
先ほど紹介したコードのwords
に寒すぎて何になるのかがリスト形式でつまっているので、ここから頻度の高いワードを抜き出せば、真理の扉が開く。今回は上位20位までを集計した。
counter = Counter(words)
print("「寒すぎて〇になった」の種類:{}".format(len(counter)))
print("トップ20 !!")
top10 = counter.most_common(20)
for i, (name, count) in enumerate(top10):
print("第{}位:寒すぎて{}になった -> {} tweets".format(i+1, name, count))
なお、実装はこちらに公開している。→GitHubリンク:dannyso16/too-cold-to-become
結果発表
「寒すぎて〇になった」の種類は、合計1654つもあった。1654種の頂点に立ったのは…
1位:サムス
なんと7411個中740個と約10%の人間は寒すぎるとサムスになる!!
1位サムス、6位サムス・アラン、15位ゼロスーツサムスと上位3つを同一人物が独占し、圧倒的な強さを見せつけた。サムス関係の単語は見た感じかなり多くて、メトロイドファンしかわからないようなメタなものも多くあった。
- 任天堂のコンピュータゲーム『メトロイド』シリーズに主人公として登場する架空の人物[1]
- リドリー:(補足)サムスの敵
- 終点ステ端で横BチャージBするサムス:(補足)スマブラかな
- ゼーベス星人
これは「寒すぎてサムスになった」があまりに人気な表現のため、奇をてらって少しメタな発言をしているのだと思われる。つまり寒すぎてサムスになるのは、日本全国?共通なようで一安心。
2位:サム
個人的に優勝候補かと思っていたサムは7411投稿中403投稿と1位のサムスには遠く及ばない結果に…。12位のSAMと同一人物だと仮定しても、サムスには遠く及ばず。(というかサムって誰やねん)
2021/01/04追記:TRFのSAMさんが有名だそうです。かっこいい
3位:サムゲタン
3位には韓国料理のサムゲタンがランクイン。7411 中 140 tweets だった。やっぱ寒い時期にはサムゲタン!
4位~20位
ここからは一気に紹介!
- 第4位:サムギョプサル -> 104 tweets
- 第5位:サムスン -> 74 tweets
- 第6位:サムス・アラン -> 70 tweets
- 第7位:サムスン電子 -> 68 tweets
- 第8位:侍 -> 55 tweets
- 第9位:サムライ8 -> 49 tweets
- 第10位:サム・スミス -> 48 tweets
- 第11位:サムライ -> 48 tweets
- 第12位:SAM -> 39 tweets
- 第13位:サム・ポーター・ブリッジズ -> 39 tweets
- 第14位:サムシングエルス -> 36 tweets
- 第15位:ゼロスーツサムス -> 36 tweets
- 第16位:ハッサム -> 35 tweets]
- 第17位:サム・ライミ -> 33 tweets
- 第18位:Samsung -> 28 tweets
- 第19位:サムネイル -> 28 tweets
- 第20位:サムワン海王 -> 28 tweets
こう見ると**韓国勢がとっても強い!**3位のサムゲタンに始まり、4位にサムギョプサル、5位サムスン、7位サムスン電子、18位にSamsungがランクインしている。冬といえば韓国というイメージが深層心理にあるんだろうか。またこちらもメタな表現が多々あり、삼성전자(samsungの韓国語)や「韓国最大の電子機器メーカー」「GALAXY」などもあった。
またサムライも根強い人気があるようだ。8位サムライ8、9位侍、11位サムライを足すと全体の2%ほどになった。やはり日本男児たるもの寒いときはサムライになるのが自然な発想なようだ。
サムライ8はNARUTOで有名な岸本斉史さんの漫画らしい。知らなかった。
どうでもいいけど10位のサム・スミスはサムライに挟まれていてかわいそうだ。オセロ理論でサム・スミスにもぜひサムライになっていただきたい。
13位のサム・ポーター・ブリッジズはゲーム「DEATH STRANDING」の主人公らしい。
画像の通り、ノーマン・リーダスがかっこいいのは自明なので、みんな憧れがあるに違いない。
おまけ:個人的に好きなやつ
以下に個人的におもしろかった投稿を列挙していく。
過剰表現
- 寒すぎて全身が紫になった
- 寒すぎて地球が嫌いになった
- 寒すぎてちんちん0cmになった
- 寒すぎて身体中が霜降り肉になった
- 寒すぎて体温マイナス5000兆度になった
- 寒すぎて指が894576908672452156809本凍傷になった
- 寒すぎて光の速度で布団に入ったら家が消し炭になった
- 寒すぎて大声出したら衝撃波がOFF波動になってあたり一面更地になった
声に出して読みたい名作ぞろいで感動。
天才すぎてよくわからない系
- 寒すぎて金玉が特異点になった
- 寒すぎてついに服を着るようになった
- 寒すぎて乳首がおやつカルパスになった
これらはぼくの脳みそでは理解できなかったが、きっと高尚な話だと思う。
もはや文学
- 寒すぎて完全に雪の降る町になった
- 寒すぎてちょっと気になってる子から背後からいきなり冷たい手で首元に手を突っ込まれて「おはよー!😆」「ぎゃー!😆」ってやってる高校生になった
- 寒すぎて遠くで鳴る境内の祭り囃子君が居なくたって夏は過ぎるけど知らせ無くとも今か今かと待ち人の面影に振り返り祭りの後闇と静寂が落ちて砂浜に花火と狂騒の残骸季節巡れど心は止まったまま君が出てったあの時のままになった
- 寒すぎてサムスわねそしてサムスとなった俺は世界を手に入れたしかしその代償は決して軽いものではなかった強すぎる力の前に身体がついてこなくなった肌は焼け明るみに出た地肌を冬の気温が襲い俺の体温を奪っていくこれはサムスになった
高校生のやつは、もはや短編小説だと思う。本業は詩人かなにかなのだろうか。
最後に
実は表記ゆれの扱いがすごく難しい内容だった。例えばサムスには多くのバリエーションがあって、「寒す」「𝙎𝙖𝙢𝙪𝙨」「サムす」「𝒮𝒶𝓂𝓊𝓈」「ゼロスーツサムス(全裸)」など数多くあり、それらを統一してランキングを作成することができなかった。まじめに集計するのは大変そうだし、やり方がわからないし、そもそもそこまでやる気がなかった...。
詳しい方はぜひ「人は暑すぎると何になるのか」を全力で調査してほしいです!
あと、どうでもいい補足ですが、この記事を書いたきっかけは以下のツイートを見たことでした。
寒すぎてしまりんになった pic.twitter.com/S5or5eJMaC
— しろし (@shirofox) December 14, 2020
反射的にいいねを押そうとしたらTwitterが勝手に更新されてしまう現象が起きて、「寒すぎ しまりん」で必死に探したことがはじまりでした。そんなきっかけをくれた**アニメ「ゆるキャン△」は2021年1月から2期が始まります!**ぜひ見ていただいて、みんなで「寒すぎてしまりんになった」になりましょう!