#UfoCatch -> python
UfoCatchを参考にXBRLにアクセスしてみる
使い勝手はUfoCatchに近づけたい
取得元
TDNET→有価証券報告書
EDINET→決算短信・コーポレートガバナンス報告書(インスタンスのみ?)
ある銘柄のEDINET上の有報の一覧を取得する
→UCXEdinetXBRLInstance(code)
決算情報の取得(サンプルシート)
→UCXEdinetXBRLInstanceLatestASR(code,close_date)
xbrlのurlに含まれる文字列と年度期間一致する有価証券報告書のurlを取得する
→UCXFact(url,elementName,baseDate,[periodStart],[consolidated],[namespace])
要素が単年度・連結の値かはcontextRefのConsolidated..で判断
xbrlの細かいところは本を読んでもさっぱり覚わらなかったため、
年度の有価証券報告書に絞って必要な部分のみ都度確認。
→インターネット財務情報システム―XML技術とXBRLデータ標準を用いた
日置電機株式会社(code:6866)の2009年‐第58期-有価証券報告書
http://resource.ufocatch.com/xbrl/edinet/ED2010030100130/S0005ASQ/jpfr-asr-E01999-000-2009-12-31-01-2010-03-01.xbrl
##xbrl有価証券報告書
-Root:<xbrli:xbrl>
-1:<link:.../>
-1:<xbrli:context id=..>..</xbrli:context>
-1:<xbrli:unit id=..>...</xbrli:unit>
-1:<jpfr-t-cte:.. unitRef=.. contextRef=.. ..>..</jpfr-t-cte>
-1:<link:footnoteLink ..>..</link:footnotelink>
-</xbrli:xbrl>
下記記事を参考に作りを確認
http://www.primal-inc.com/column/2009/11/03-000045.php?page=1
要素の一覧はUfoCatchの参考_決算短信等科目リストシートを確認
売上高 -> NetSales
株主資本比率 -> shareholdersequity
この報告書だけで195の誤謬が使用されているが、UfoCatchのリストにないものも多い。大した手間でもなさそうなので必要があれば誤謬の逆引きも出来れば。
finance(codelst,entrylst) -> DataFrame(columns=enrylst,index=codelist)
のように年度の報告書からデータを取ってこれれば楽
##追記(6/19)
データの抽出が上手くいかなかったため、ufo-catchの内容そのままにした
Get facts()...
If (node.baseName <> "schemaRef" And _
node.baseName <> "context" And _
node.baseName <> "unit" And _
node.baseName <> "footnoteLink") Then