はじめに
有名な書籍「人は見た目が9割」と「人は話し方が9割」が存在することから、人の全体は少なくとも18割以上と考えられます。
他の書籍タイトルも合わせると、いったいどこまで増えるのでしょうか。
また、人以外も含めて割合が大きいのはどのような単語なのでしょうか。
このような疑問のもと、国立国会図書館のAPIを活用して「aはbがc割」形式の書籍タイトルを収集し、主語(a)の構成要素を分析してみました。
先行事例
先行事例を調査してみたところ、「9割」系書籍を収集してみた事例はありましたが、割合の合計を算出するなどの検証は未実施だったので、自分でやってみることにしました。
- 「9割」系書籍を収集してみた事例
調査方法
データ収集
国立国会図書館サーチのSRU APIを使用して、以下のクエリで書籍を検索しました。
title="が1割" AND dpid=iss-ndl-opactitle="が2割" AND dpid=iss-ndl-opac- ...
title="が9割" AND dpid=iss-ndl-opac-
title="が一割" AND dpid=iss-ndl-opac(漢数字も対応) - ...
title="が九割" AND dpid=iss-ndl-opac
dpid=iss-ndl-opac で国会図書館の蔵書(主に図書)に限定し、助詞「が」を必須とすることでノイズを削減しました。
タイトルのパース
収集したタイトルから「aはbがc割」のパターンを抽出するため、以下の手順でパーサーを実装しました
- 正規表現マッチング:
(?P<a>.+?)は(?P<b>.+?)が(?P<c>(?:10|[1-9])\s*割|[一二三四五六七八九]割)パターンでマッチング - aのクリーニング:
- 括弧類(「」『』【】()など)を削除
- 形態素解析で「は」の直前の名詞句のみを抽出
- bのクリーニング: 括弧類や先頭の句読点を削除
- cの数値化: 「9割」→ 9、「九割」→ 9 のように変換
結果
収集データの概要
- 収集タイトル数: 364冊
- 重複除去後のタイトル数: 341冊
- パース成功数: 237冊
- ユニークなa(主語)の種類: 143種類
aランキング TOP 10
各aについて、出現冊数とc値の合計でランキングしました:
| 順位 | a(主語) | 冊数 | c値合計 | 代表例 |
|---|---|---|---|---|
| 1 | 人 | 14 | 126 | 仕事ができる人は「話し方」が9割 人は見た目が9割 好かれる人は話し方が9割 |
| 2 | 仕事 | 10 | 90 | 仕事は職場が9割 介護の仕事は「聴く技術」が9割 |
| 3 | 原因 | 7 | 60 | 突然死の原因は「心疾患」が6割 疲れがとれない原因は副腎が9割 |
| 4 | リーダー | 5 | 45 | リーダーは「聴く力」が9割 リーダーは「時間の使い方」が9割 |
| 4 | 人間関係 | 5 | 45 | 職場の人間関係は自己肯定感が9割 人間関係は距離感が9割 |
| 4 | 営業 | 5 | 45 | 営業は準備が9割 営業は台本が9割 |
| 4 | 子 | 5 | 45 | 成功する子は食べ物が9割 成功する子は食べ物が9割栄養ぐるぐるレシピ |
| 8 | 上司 | 4 | 36 | 上司は「信頼力」が9割 上司は話し方が9割 |
| 8 | 株 | 4 | 36 | 株は波動が9割 株はメンタルが9割 |
| 8 | 男 | 4 | 36 | 男はお金が9割 男は見た目が9割 |
「人」や「仕事」「リーダー」など日常的なテーマが大きい割合となりました。
aの構成要素
各aの構成要素を円グラフにして眺めてみます。
1位. 人
人は最も割合が大きく全体で126割でした。
構成要素としては「話し方」が圧倒的に多く、「見た目」「聞き方」が続きました。話し方だけで全体の4割強(54割)を占めています
2位. 仕事
仕事は全体で90割でした。
構成要素としては、人間関係の比重が高く、上司との関係も合わせると全体の3割(27割)が人間関係でした。
3位. 原因
「原因」は「突然死の原因」「疲れが取れない原因」のように様々な「原因」が集約された結果、第3位の割合(60割)となりました。
傾向としては、地盤を除き、身体や病気に関係する要素で構成されているようです。
4位. リーダー
リーダーは全体で45割でした。
構成要素としては「話し方」が最も多く、全体の4割(18割)を占めていました。
「話し方」が主要要素である点は「人」と同様であり、リーダーは人の部分集合であるため、似たような構成になったと考えられます。
4位. 人間関係
人間関係は全体で45割で、リーダーと同率4位でした。
構成要素としては、「自己表現」「自己肯定感」など、自己に関する要素が全体の4割(18割)を占めていました
また、「人間関係」は2位の「仕事」の主要な構成要素でもあり、(上司との関係を含めて)「仕事」の3割(27割)を占める「人間関係」の割合が45割であるという階層的な関係が伺えます。
4位. 営業
営業は同率4位の45割でした。
構成要素としては、「準備」「台本」など、事前の対策に関する要素が全体の6割(18割)を占めていました。
4位. 子
子は同率4位の45割でした。
構成要素としては、すべて「食べ物」となっています。
ただし、書籍名を見ると
- 成功する子は食べ物が9割栄養ぐるぐるレシピ : 幼児・小学生ママ必読
- 成功する子は食べ物が9割最強レシピ : 幼児・小学生ママ必読! : 食べたものでカラダはできている!
- 成功する子は食べ物が9割 : 幼児・小学生ママ必読! : 冷蔵庫の中身がカラダの中身。
など、非常にそれぞれが似通ったタイトルとなっており、同一シリーズの書籍である可能性が高いです。このため結果の一般化には注意が必要です。
8位. 上司
上司の構成要素は全体で36割であり、「会話」「話し方」など7割5分(27割)が、話し方に関するものでした。話し方が占める割合が大きいのは、「人」「リーダー」と同じ傾向であり、「上司」が「リーダー」を兼ねることも多いことを踏まえると、一貫性のある結果と考えられます。
8位. 株
株は全体で36割でした。構成要素としては、「メンタル」「波動」など、精神面に関する要素が全体の7割5分(27割)を占めていました。
8位. 男
男は全体で36割でした。構成要素としては、「お金」が全体の5割(18割)を占めています。「男」も「人」の集合ではありますが、「人」「リーダー」「上司」などで一貫して見られた「話し方」が多くを占める傾向は、「男」には見られないようです。
c(割)の分布
パースに成功した「aはbがc割」系の237冊に含まれるcの分布を見てみました。
237件中223件と「9割」が圧倒的に多かったです。「8割」も多少ありますが(10件)、7割以下はほとんど皆無でした。ただ、cが少ないほど件数も少ないかと思いきや、「1割」だけは2件存在していました。
参考までに、cが7割以下の書籍タイトルを列挙しておきます。
- 子どもの幸せは腸が7割 : 3才までで決まる!最強の腸内環境のつくりかた (7割)
- 突然死の原因は「心疾患」が6割 (6割)
- 本物の恋は"見た目"が1割 : あなたのままで「大好きな彼」から愛される方法 (1割)
- 儲かる会社は人が1割、仕組みが9割 : 今いる社員で利益を2倍にする驚きの方法 (1割)
「子どもの幸せ」「心疾患」が医療的な内容を想起させるタイトルです。それぞれ7割、6割と、多すぎないcを採用しているのはひょっとしたら、具体的なデータに基づいているからかもしれません。
「本物の恋」「儲かる会社」の「1割」はあとに続く言葉を考慮すると、多さではなく少なさを示すために用いられている可能性が高いです。限界まではいかないギリギリの値という意味で「9割」同様に「1割」が使いやすかったため、2割から5割が0件だったにも関わらず、「1割」が2件も発生したのかもしれません。
制限事項
制限事項として、本記事では、書籍タイトルの取得に国立国会図書館のAPIを使用しましたが、200冊程度しか取得できていないことから、世間に流通している書籍の一部しか取得できていない可能性が高いです。Google Books APIなど、他のデータソースを使用すれば、さらに多くの「aはbがc割」形式の書籍タイトルを収集でき、検証の一般性が高まる可能性があります。
本記事では書籍タイトルの解析対象を「aはbがc割」の形式に限定しています。本来、主語aに対するbの割合cを表現するタイトルは「aはbがc割」以外にも、「aのc割はb」「aはc割b」など数多のバリエーションがありえます。しかし、予備的な調査から「aはbがc割」以外の形式では、主語aに対するbの割合cを表現しているとは必ずしも言えないタイトルが多数混ざってしまい、ルールベースでの判定も困難であったことから、本検証では分析の対象外としました。特に「aのc割はb」系のタイトルは非常にヒット数が多かったため、これらのタイトルもうまく分析対象に含められれば、より一般性の高い結果が得られる可能性があります。
おわりに
「aはbがc割」形式の書籍237冊を分析した結果、最も割合が大きい主語aは「人」(126割)であることがわかりました。構成要素は多岐にわたっており、全体として、2桁を超える割合に達している主語が多くあることがわかり、興味深かったです。
補足
「aはbがc割」以外の分析困難なタイトル
| 形式 | 例 |
|---|---|
| aのc割はb | あなたの話の9割は相手に伝わっていません。 アレルギーの9割は腸で治る! YESの9割はフロントトークで決まる! |
| aのc割がb | 塾生の9割が成績がアップした秘訣公開 国民の9割が知らない、日本の「今」と「これから」 不登校の9割以上が2週間から1ヵ月で登校できるようになっている! |
| aのc割をb | 赤字会社の9割を黒字化させた経営の基本 お客さまの9割をリピーターにする33のしくみ |
| b1でaのc割が(は)b2 | ウォーキング+食生活改善で病気の9割が消えていく!! 生まれ年で人の9割がわかる! お尻をもむだけで痛みの9割は消える |
| aのc割b | 運動未満で体はととのう : 人生の9割""体調悪い""あなたへ" 絵師の9割筆を折る残りの1割筆を売る |
| aはc割b | 夢は9割叶わない。 メンターが見つかれば人生は9割決まる! 改善率は9割!専門医が勧める「首の3点もみ」 8割捨てたら仕事は9割うまくいく |
| b1がaのc割をb2 | 「噛む力」が病気の9割を遠ざける |
| b1でaはc割b2 | 20代で人生の年収は9割決まる 3つの聞き方だけで仕事は9割うまくいく |
| aはc割方b | 人は八割方悪である |
ソースコード
本分析のソースコードはGitHubで公開しています:
book-title-ratio-analysis
参考記事・文献
-
国立国会図書館サーチ API仕様: https://ndlsearch.ndl.go.jp/help/api/specifications
-
記事内で言及した書誌データ
- 国立国会図書館サーチ(NDL Search)SRU APIより取得した内容に基づきます。










