この記事は全4本シリーズの4本目です。過去の記事をまだ読んでいない方は、ぜひ1本目からご覧ください。
過去の記事がこちらです。
0. 学習の前に
0-1. 全体のゴール
- BigQueryのオープンデータから、自分が欲しいデータを抽出する
- 抽出したデータを分析する
0-2. 技術
- BigQuery
- Colaboratory
- Google Cloud Platform
- Google Gemini
- Python3
- SQL
0-3. この記事で扱う範囲
● 1. データセットの選択
● 2. 集計データの内容
● 3. 結果の事前予想
● 4. データ抽出
* 4-1. アメリカで人気の名前年間トップ10(表)
* 4-2. アメリカで人気の名前年間トップ5の推移(折れ線グラフ)
・4-2-1. Googleアカウント認証
・4-2-2. SQLクエリ定義
・4-2-3. BigQueryからPandasへ読み込み
・4-2-4. データの集計と折れ線グラフ化
* 4-3. アメリカ年間出生者数に占めるトップ10の割合の推移(帯グラフ)
・4-3-1. データセットからデータ抽出
・4-3-2. SQLクエリ定義
・4-3-3. BigQueryからPandasへ読み込み
・4-3-4. データの集計と帯グラフ化
● 5. データ分析
* 5-1. 登録者数に占める名前人気トップ10の割合の減少
・5-1-1. 女の子
・5-1-2. 男の子
* 5-2. ボーダーレスな名前の増加
* 5-3. ユニセックス・男女ペアの名前の増加
・5-3-1. ユニセックスな名前
・5-3-2. 男女ペアの名前
* 5-4. 1910年と2021年のトップ10比較
・5-4-1. 女の子
・5-4-2. 男の子
* 5-5. トップ5入りする名前の変遷
・5-5-1. 女の子
・5-5-2. 男の子
* 5-6. その他
・5-6-1. 2022年以降のデータ
今回はデータ分析のみです。「前回までの集計データからわかることはこれ!」という発表だけなので、技術的な知見の共有などはありません。ただの結果発表であることをご了承いただける方は、引き続きお付き合いいただけると幸いです。
5. データ分析
前回までの記事で抽出したデータをもとに、アメリカの赤ちゃんの名前の傾向を分析します。まずは3.での予想と実際のデータを突き合わせ、傾向を探ります。そのあと、「その他」として予想には含めなかった項目を分析します。
なお、トップ10圏外のデータは深追いしません。一方でトップ10圏内であれば、出力したグラフ以外からもデータを引っ張ります。
私は統計学やデータ分析系についての専門的な知識皆無です。もし的外れな見解を述べていたら、こっそりコメントしていただけると助かります。
5-1. 登録者数に占めるトップ10の割合の減少
最初の記事では、私は以下のように予想しています。
移民の増加によって名前が多様化し、各年・性別ごとの登録者数に占めるトップ10の割合は、現代に近づくほど低下する
結論から言えば、この予想は男女ともに正解でした。
5-1-1. 女の子

ピーク時(1940年代後半)には、トップ10の名前だけで全体の約1/4を占めていました。しかし現代に近づくにつれてこの割合は減少し、2021年時点では約1割に落ち着きます。1950年代後半に20%を下回って以降は緩やかに減少しましたが、1960年代後半からは持ち直し、1980年代半ばには再び20%台に乗ります。
1988年以降は前年比で微増した年もあるものの、基本的には横ばいか減少傾向です。
5-1-2. 男の子

女の子以上にトップ10の占有率が高かったのは男の子。1910、1911年に生まれた男の子の名前のうち、トップ10が35%以上を占めました。女の子は1950年代後半にトップ10の割合が2割を下回るものの、男の子は1960年代半ばまで3割をキープ。初めて2割を下回ったのは1990年代です。
また、男の子のグラフでは、前年比微増の年があっても、全体としては1950年頃から一貫して減少傾向です。この点も、1960年代後半から20年ほどトップ10の占める割合が増加傾向だった女の子とは異なります。直近10年が横ばいな点は男女ともに同じです。
5-2. ボーダーレスな名前の増加
最初の記事では、私は以下のように予想しています。
現代に近づくにつれ、国籍に限定しない名前が上位に入りやすくなる(例:ハナコは日本的、アンはボーダーレス)
正直なところ、英語圏らしくない名前はあまり見受けられませんでした。「英語圏らしい」の定義は、「私がぱっと見で読み方を判断できる」です。私の英語力や知識量に依存しています。この基準でいうところの英語圏らしくない名前は、男女で1つずつ見つかりました。
- Abigail(2001~2017年にトップ10入り)
- Elijah(2016~2021年にトップ10入り)
調べたところ、どちらも旧約聖書にゆかりのあるヘブライ語由来の名前で、いずれも21世紀以降にトップ10入りしています。さらに両者ともトップ5に入った経験があり、特に男の子の名前・Elijahは9位での初登場以降、順位を上げ続けています。
5-3. ユニセックス・男女ペアの名前の増加
最初の記事では、私は以下のように予想しています。
現代に近づくにつれ、ユニセックスな名前(例:Alex、Taylor)や、男性名と女性名で対になる名前(例:Gabriel/Gabrielle、Jonathan/Johanna)が増える
5-3-1. ユニセックスな名前
男女両方でトップ10入りした名前はありません。ユニセックスな名前としてはHarperとTaylorが挙げられますが、どちらも男の子ではトップ10入りしていません。両者とも女の子に多い名前です。
5-3-2. 男女ペアの名前
男女ペアでトップ10入りしていたのは2ペアでした。
| 男の子 | 女の子 | ||||
|---|---|---|---|---|---|
| 名前 | 初登場 | 最終登場 | 名前 | 初登場 | 最終登場 |
| Alexander | 2008 | 2020 | Alexis | 1996 | 2003 |
| Nicholas | 1993 | 2002 | Nicole | 1972 | 1988 |
ペアでランクインした年代に重複はなく、ペアだからといって特別な傾向は見られませんでした。また、一見Oliver・Oliviaはペアに見えますが、厳密には異なるようです。
5-4. 1910年と2021年のトップ10比較
最初の記事では、私は以下のように予想しています。
1910年のトップ10と2021年のトップ10は、ほぼ完全に入れ替わる(古風な名前が減り、現代的な名前が増える)
結論は、「女の子は総入れ替え」「男の子は約2/3入れ替え」でした。
5-4-1. 女の子
| 1910 | rank | 2021 |
|---|---|---|
| Mary | 1 | Olivia |
| Helen | 2 | Emma |
| Margaret | 3 | Charlotte |
| Dorothy | 4 | Amelia |
| Ruth | 5 | Ava |
| Anna | 6 | Sophia |
| Elizabeth | 7 | Isabella |
| Mildred | 8 | Mia |
| Marie | 9 | Evelyn |
| Alice | 10 | Harper |
一切の重複がありません。
1910年に人気の名前
1910~2021年の112年間で、トップ10登場回数が最も多いのはMary(62回)で、Elizabeth(43回)が続きます。ただしMaryが最後にトップ10入りしたのは1971年と半世紀以上前である一方、Elizabethは2013年までトップ10入りしていました。
トップ10登場回数の上位10の名前のうち、過半数は1910年に登場しています。しかし、21世紀にもランクインしているのはElizabethだけです。9位のMarieは1910~1914年に5年連続でランクインしたのみ、10位のAliceに至っては1910年の一度きり。とはいえ、どちらも日本人にも聞き馴染みのある名前で、流行に左右されない定番ネームと考えられます。
一方で8位のMildredは聞き馴染みがなく、調べたところ現代ではトップ1000圏外という情報もありました(深追いしないためデータ未確認です)。
2021年に人気の名前
2021年9位のEvelynは登場回数こそ6回と少ないものの、初登場は1915回と古参ネームです。Evelynの次に初登場が古いのはOlivia(2001年)。もちろんOliviaも古くから存在する名前ですが、2021年にトップ10入りした名前は、いずれも21世紀以降に人気が上昇した名前でした。
2021年のトップ10の顔触れは、Ameliaが初登場した2017年以降ほぼ同じです。2017年も10位がAbigailだっただけで、Harper以外の顔触れは変わりません。また、EvelynとHarper以外は、トップ10に浮上して以来、一度もトップ10圏外に落ちていません。
5-4-2. 男の子
| 1910 | rank | 2021 |
|---|---|---|
| John | 1 | Liam |
| James | 2 | Noah |
| William | 3 | Oliver |
| Robert | 4 | Elijah |
| George | 5 | James |
| Joseph | 6 | William |
| Charles | 7 | Benjamin |
| Frank | 8 | Lucas |
| Edward | 9 | Henry |
| Henry | 10 | Theodore |
James、William、Henryと3つの名前が重複しています。ちなみにHenryのトップ10登場回数は3回。1910年の次が2020年と110年飛び、2021年に連続でランクインしました。今回の調査対象はアメリカの赤ちゃんなので偶然の可能性が高いですが、どれも現在のイギリス王室にゆかりのある名前です。
1910年に人気の名前
トップ10登場回数のトップ10のうち、過半数が1910年に登場している点は女の子と同じ。ただし、女の子の最多登場であるMary(62回)に対し、男の子では最多のJames(91回)から5位のMichael(74回)まで、Maryの登場回数を上回ります。つまり、男の子の上位層は、女の子以上に特定の顔触れによる寡占状態でした。
2021年に人気の名前
1910年にもランクインした3つの名前を除くと、初登場が古いのはNoah(2009 年)。これまた女の子同様に、3つの名前以外は一度トップ10入りすると、2021年までずっとランクインしています。歴史ある名前と近年人気急上昇した名前の混在は、女の子にはない特徴です。
5-5. トップ5入りする名前の変遷
最初の記事では、私は以下のように予想しています。
移民の増加によって名前が多様化し、現代に近づくほどトップ5の入れ替わりが激しくなる
男女とも、結論は「必ずしも現代に近づくほど入れ替わりが激しくなるとはいえない」です。女の子は2000~2010年頃、男の子は2010年代前半こそ入れ替わりが激しかったものの、現代はそれらの時代より入れ替わりが鈍化しています。全体的な傾向としては、入れ替わりが鈍化する時期と激化する時期を繰り返しています。
5-5-1. 女の子

男の子に比べると女の子の名前は入れ替わりが激しく、トップ5では45、トップ10では77の名前がランクインしました。
1910年のトップ5はMary(赤)、Helen(オレンジ)、Margaret(緑)、Dorothy(ピンク)、Ruth(黄緑)。さらに、1920年代前半に登場したBetty(水色)を加えた6つの名前が、1930年頃までトップ5を占めていました。1930年代後半、1950~1970年頃、そして1990~2010年頃に入れ替わりが激しくなります。
ただし、変動が大きいのは2位以下の話。全体を通して1位の変化は多くありません。半世紀近く1位にいたMaryが突出していますが、JenniferとEmilyも10年以上トップを独占しています。112年間を通して、1位を獲得した名前は以下の11個です。
- Mary:1910~1946、1953~1961(46年間)
- Linda:1947~1952(6年間)
- Lisa:1962~1969(8年間)
- Jennifer:1970~1984(15年間)
- Jessica:1985~1990、1993~1995(9年間)
- Ashley:1991~1992(2年間)
- Emily:1996~2007(12年間)
- Emma:2008、2014~2018(6年間)
- Isabella:2009~2010(2年間)
- Sophia:2011~2013(3年間)
- Olivia:2019~2021(3年間)
5-5-2. 男の子

女の子に比べると男の子の名前はトレンドに左右されにくく、トップ5では28、トップ10では51の名前がランクインしました。
1910年のトップ5はJohn(赤)、James(青)、William(グレー)、Robert(ブラウン)、George(黄緑)。女の子のグラフと比べて変化に乏しいのは明らかで、1960年代までは「Charles、David、Joseph、Michael、Richard」を加えた10個の名前以外はトップ5に登場しません。1980年まで広げても状況はほぼ同じで、1972年に初登場のChristopher、翌年に登場するJasonを合わせた計12個の名前でトップ5が占められ続けます。
2000年代後半から入れ替わりは激しくなりますが、112年全体で見ると変化は少ないままです。40年以上1位にいたMichaelが突出しており、2010年代のNoahとLiamを除くと、10年以上1位を維持した名前ばかりな点も特徴です。
Davidは1位こそ1960年の一度きりですが、1950~1984年までトップ5をキープし、長期的な人気が見て取れます。112年間を通して、1位を獲得した名前は以下の11個です。
- John:1910~1923(14年間)
- Robert:1924~1939、1953(17年間)
- James:1940~1952(13年間)
- Michael:1954~1959、1961~1998(44年間)
- David:1960(1年間)
- Jacob:1999~2012(14年間)
- Noah:2013~2016(4年間)
- Liam:2017~2021(5年間)
5-6. その他
5-6-1. 2022年以降のデータ
BigQueryのUSA Name Dataには2021年までの情報しかなく、それ以降の順位が気になっていました。調べたところ、今月に入ってBaby Centerから今年のランキングが発表されていました。さらに、Baby Centerのウェブサイトで2022~2024年のトップ10も確認できたため、2021年と合せて直近5年間のトップ10をまとめました。
女の子
| Girls | 2021 | 2022 | 2023 | 2024 | 2025 |
|---|---|---|---|---|---|
| 1 | Olivia | Olivia | Olivia | Olivia | Olivia |
| 2 | Emma | Emma | Emma | Emma | Amelia |
| 3 | Charlotte | Amelia | Amelia | Amelia | Sophia |
| 4 | Amelia | Ava | Sophia | Sophia | Emma |
| 5 | Ava | Sophia | Charlotte | Charlotte | Isabella |
| 6 | Sophia | Isabella | Ava | Isabella | Charlotte |
| 7 | Isabella | Luna | Isabella | Ava | Eliana |
| 8 | Mia | Mia | Mia | Mia | Ellie |
| 9 | Evelyn | Charlotte | Luna | Ellie | Aurora |
| 10 | Harper | Evelyn | Evelyn | Luna | Mia |
2014年から続いたEmma・Oliviaの2強に終止符が打たれました。また、2022年以降でトップ10に入った以下の名前は、いずれも1910~2021年はトップ10圏外でした。これらの名前は、いずれもラテン系・ヨーロッパ系の名前です。
- Luna(2022年)
- Ellie(2024年)
- Eliana(2025年)
- Aurora(2025年)
男の子
| Boys | 2021 | 2022 | 2023 | 2024 | 2025 |
|---|---|---|---|---|---|
| 1 | Liam | Liam | Noah | Noah | Noah |
| 2 | Noah | Noah | Liam | Liam | Liam |
| 3 | Oliver | Oliver | Oliver | Oliver | Oliver |
| 4 | Elijah | Elijah | Elijah | Elijah | Elijah |
| 5 | James | Mateo | Mateo | Mateo | Mateo |
| 6 | William | Lucas | Lucas | Lucas | Levi |
| 7 | Benjamin | Levi | Levi | Levi | Lucas |
| 8 | Lucas | Asher | Leo | Leo | Ezra |
| 9 | Henry | James | Ezra | Ezra | Asher |
| 10 | Theodore | Leo | Luca | Luca | Luca |
1910年・2021年両方でトップ10入りしたJames、William、Henryは、2022年以降ランクインしませんでした。Liam・Noahの2強は2014年から今年まで続いていますが、トップ5に広げてもほぼ変動はありません。
6~10位は、2021年の8位・Lucas以外が総入れ替えです。また、2022年以降でトップ10に入った以下の名前は、いずれも1910~2021年はトップ10圏外でした。Asher、Ezra、Leviはいずれもヘブライ語由来の名前です。他の3つはヨーロッパ系のルーツがあります。
- Asher(2022年)
- Ezra(2023年)
- Leo(2022年)
- Levi(2022年)
- Luca(2023年)
- Mateo(2022年)
全体まとめ
自分でテーマを立てたデータ分析は初めてでしたが、時間さえあれば分析にはいくらでも時間を溶かせそうです。他に調べたかった内容は、以下の通りです。
- BigQueryのUSA Name Dataの項目'state'を使い、出生州の人種・民族分布と名前のルーツの傾向を探る
- スペル違いの名前(例:An、Ann、Anne)を読み方で再集計
- その時代に活躍した有名人の名前が急上昇するか
他にも調べたい項目は出てくると思いますが、現時点で思いつくのはこのあたり。
いずれも、トップ100くらいまで調査範囲を広げる必要がありそうです。
これにて「BigQueryオープンデータを用いたアメリカの赤ちゃんの名前ランキング分析」の学習記録を終了します。ここまでご覧いただき、ありがとうございました!