1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

サイアーラインの可視化2

Last updated at Posted at 2023-08-22

1. はじめに

  • 前回の続き
  • 世界のサイアーラインを可視化した。
  • Northern DancerとMr. Prospector強い。Northern Dancerの孫のガリレオが目立ちますね。

2.経緯

前回は主に、日本国内がサンデーサイレンス系で埋め尽くされているのを発見。

  • 世界ではどうなっているのか気になったので、調べてみることに。

3. コード

  • 前回のはJRDBのデータを使ったけど、wikipedia(en)の情報も使えそうだったので、こちらを利用させてもらう。
  • さてスクレイピングやるのかなーと思っていると、dbpediaというサイトを発見して、sparQLという言語?でクエリを取ると簡単に情報を得られるのを発見。これを使わせてもらう。

この図の右下部分(父、父父)情報を使えばいいので、下記のような書き方で取得できた。
image.png

en.wikipediaには、生まれ年毎に有名な競走馬の情報が入っているので、この情報を参考に、

#!pip install sparqlwrapper
def getdata(year):
    my_variable = "<http://dbpedia.org/resource/Category:{}_racehorse_births>".format(year)
    print(my_variable)
    sparql.setQuery("""
    select distinct * where {
    ?racehorse <http://dbpedia.org/ontology/wikiPageWikiLink>"""+ my_variable +""" .
    ?racehorse rdfs:label ?name .
    ?racehorse <http://dbpedia.org/property/sire> ?sire .
    ?racehorse <http://dbpedia.org/property/grandsire> ?grandsire .
    }
    """)
    results = sparql.query().convert()

    items = []
    for val in results["results"]["bindings"]:
        if val["name"]["xml:lang"] == "en":
            items.append([val["name"]["value"],val["sire"]["value"].replace("http://dbpedia.org/resource/","")])
            items.append([val["sire"]["value"].replace("http://dbpedia.org/resource/",""),val["grandsire"]["value"].replace("http://dbpedia.org/resource/","")])


    return pd.DataFrame(items)

image.png

これを1700年~2020年まで取得。データをキレイにして最終的にこんな形に。
image.png

あとはpyvisなど検討したけれど、動作が重いので結局gephiに。
image.png

  • 上の真ん中へん、Sadler's WellsやGalileoが見えるでしょか。ピンク色がNorthernDancerでその辺の系統はすべてNorthernDancer系。
    image.png

  • あとは左はじの水色がMr. Prospectorです。アメリカで大繁栄しているそうで。
    image.png

  • 日本のサンデーサイレンスやディープインパクトはnearcoから分岐して全体図での右側へ。近くにはhail to reasonから分岐してrobert(ナリタブライアン、マヤノトップガン、ブライアンズタイムなどの系統)が。
    image.png

  • 下部分はst.simon、eclipse、hyperionなどの昔の超有名な名馬たち。なんかつながり方がおかしいのでまた確認していこう。3大始祖までうまくつながってくれていない。
    image.png

image.png
image.png

  • Daley Arabianを発見。
    image.png

  • Byerley Turkを発見。緑色なのでちょうど全体図の真ん中あたり。
    image.png

  • Godolphin Arabianを発見。wikipediaに記事が少ない影響で孤立しててちょっと悲しい。血統表情報で補完してつなげたい。
    image.png

  • 20230822:全体図を少し整理
    image.png

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?