More than 1 year has passed since last update.

サイアーラインの可視化２

Last updated at 2023-08-23Posted at 2023-08-22

1. はじめに

前回の続き
世界のサイアーラインを可視化した。
Northern DancerとMr. Prospector強い。Northern Dancerの孫のガリレオが目立ちますね。

2.経緯

・前回は主に、日本国内がサンデーサイレンス系で埋め尽くされているのを発見。

世界ではどうなっているのか気になったので、調べてみることに。

3. コード

前回のはJRDBのデータを使ったけど、wikipedia(en)の情報も使えそうだったので、こちらを利用させてもらう。
さてスクレイピングやるのかなーと思っていると、dbpediaというサイトを発見して、sparQLという言語？でクエリを取ると簡単に情報を得られるのを発見。これを使わせてもらう。

この図の右下部分（父、父父）情報を使えばいいので、下記のような書き方で取得できた。

en.wikipediaには、生まれ年毎に有名な競走馬の情報が入っているので、この情報を参考に、

#!pip install sparqlwrapper
def getdata(year):
    my_variable = "<http://dbpedia.org/resource/Category:{}_racehorse_births>".format(year)
    print(my_variable)
    sparql.setQuery("""
    select distinct * where {
    ?racehorse <http://dbpedia.org/ontology/wikiPageWikiLink>"""+ my_variable +""" .
    ?racehorse rdfs:label ?name .
    ?racehorse <http://dbpedia.org/property/sire> ?sire .
    ?racehorse <http://dbpedia.org/property/grandsire> ?grandsire .
    }
    """)
    results = sparql.query().convert()

    items = []
    for val in results["results"]["bindings"]:
        if val["name"]["xml:lang"] == "en":
            items.append([val["name"]["value"],val["sire"]["value"].replace("http://dbpedia.org/resource/","")])
            items.append([val["sire"]["value"].replace("http://dbpedia.org/resource/",""),val["grandsire"]["value"].replace("http://dbpedia.org/resource/","")])


    return pd.DataFrame(items)

これを1700年～2020年まで取得。データをキレイにして最終的にこんな形に。

あとはpyvisなど検討したけれど、動作が重いので結局gephiに。

上の真ん中へん、Sadler's WellsやGalileoが見えるでしょか。ピンク色がNorthernDancerでその辺の系統はすべてNorthernDancer系。
あとは左はじの水色がMr. Prospectorです。アメリカで大繁栄しているそうで。
日本のサンデーサイレンスやディープインパクトはnearcoから分岐して全体図での右側へ。近くにはhail to reasonから分岐してrobert（ナリタブライアン、マヤノトップガン、ブライアンズタイムなどの系統）が。
下部分はst.simon、eclipse、hyperionなどの昔の超有名な名馬たち。なんかつながり方がおかしいのでまた確認していこう。３大始祖までうまくつながってくれていない。

Daley Arabianを発見。
Byerley Turkを発見。緑色なのでちょうど全体図の真ん中あたり。
Godolphin Arabianを発見。wikipediaに記事が少ない影響で孤立しててちょっと悲しい。血統表情報で補完してつなげたい。
20230822：全体図を少し整理

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up