ティッカーシンボル名は本当にAから始まるのが多いの?
とあるストラテジーの検証をしていたところ,ひっかかるティッカーがA,B,C から始まる銘柄ばかりがでてくるという現象に当たったので,もしかして銘柄名はA,B,Cから始めるモノが多いのではないか?と思い, Quantopian で確認してみました.
from quantopian.pipeline.data.builtin import USEquityPricing
from quantopian.research import run_pipeline
from quantopian.pipeline import Pipeline
from quantopian.pipeline.factors import Returns
from collections import Counter
# 銘柄名を取得したいだけなので,pipelineに吐き出させるデータは何でもいい.
def make_pipeline():
pipe = Pipeline()
five_days_return = Returns(inputs = [USEquityPricing.close], window_length=5)
pipe.add(five_days_return, 'five_days_return')
return pipe
results = run_pipeline(make_pipeline(), start_date="2018-1-1", end_date="2018-1-3")
syms = [sym.symbol for sym in results.loc["2018-1-2"].index.get_level_values(1).unique()]
data = [sym[0] for sym in syms]
counter = Counter(data)
df_initials = pd.DataFrame(counter.most_common(), columns=["initial", "count"])
df_initials["pct"] = df_initials["count"] / df_initials["count"].sum()
df_initials.sort_values(by="pct", ascending=False)
そうでもない...
(もし上場することがあったら目立つためにYからはじめよう)
counter 便利!
イニシャルをどのように数えたらかっこいいかな?と思ったらこんな方法があるんですね!便利でした!
Pythonで単語の数え上げとかするならCounterを使うと便利なはなし - Qiita