前回のおさらい
ChatGPTのいくつかの機能を利用しましたが,決算短信を読み込ませ分析させることができませんでした.
原因は大きく2つありました.
- 決算短信の特徴的なフォーマット
- 文字化け
これらに対応できそうな方法でパッと思いつくのは,
- 決算短信をpdfではなく,画像として読み込む
- pdfを自力で構造データに落とし込む
- pdf以外のデータソースを見つける
この3点です.しかしながら今回の記事ではこれらの対処法について少しも実践していません.なぜならば新機能によってその問題が解決できそうだったからです.
新機能: My GPTs
My GPTsは特定の目的に向けて自身でGPTのスタイルや知識をカスタマイズすることができます.
今までは長文のプロンプトをいちいち投げていましたが,これからは決算短信を投げるだけで分析してその結果を返すことができそうです.
決算短信分析をさせるにあたって
まず,最終成果物であるGPTのリンクを貼っておきます.
GPT作成時に,注意したことを以下にまとめます.
ターゲットは誰か?
今回,株式投資の初心者から中級者向けに分析結果を伝えることが主題です.
pdfの読み込みについて
前回,pdfをアップロードしても最初の2ページしか読み込まれない,文字化けする,表を上手に読み取れないなどの問題が発生したため,OCR (光学的文字認識)で分析してくださいとお願いしてみました.
事実と考察の区別
一般的に重要であることですので,GPTにもこの区別を行うように指示しました.
何に焦点を当てるか
決算短信には定量的な情報と定性的な情報が存在します.
業績や財務などの定量的な情報,後発事象や注意事項など定性的な情報それぞれに対し焦点を当て,異なるプロンプトを使用することをユーザーに推奨します.
ハルシネーション対策
嘘の情報を捏造してしまうことがあります.
そこで,不明な点があった場合の動作として,不明であると述べるか,ウェブで調べるかをGPTが選択します.
また,その途中で情報に矛盾がある可能性があればもう一度調べ直して正確な情報を提示するように指示しています.
回答の記述量
文字数が多すぎると,TL;DR (Too Long; Didn't Read)と言われるように読みたくありません.
一度に回答する量を減らしたいが情報量を削るわけにもいかないので,出力する内容を絞り,追加で聞くための選択肢を提供することにしました.
回答の最後に以下の文章を出力してください.
追加で知りたいことは何ですか?
1. 企業の基本情報,全体の業績とセグメントごとの業績
2. 株価に影響を与える事象の分類
3. その他,後発事象や備考,注意事項,定性的な情報など
4. GPTの考察
とGPT Builderに伝えるとよしなにしてくれます.
PDFを投げてみる
ぜひ使ってみて欲しいのですが,決算短信をダウンロードして,というのが面倒な方向けに少しだけ触りを紹介します.
例として伊藤忠商事の決算短信を投げてみました.
まずは基本的な情報を返します.これに関してはそのまま決算短信読んでも大差ないですね.
My Consideration以下,GPTによる評価が行われます.
返答の最後には続けて提供可能な情報が提示されます.
2を選んでみると,重要な変更についての記述を得ることができました.
同様に,最後には続けて提供な情報が提示されます.
このように,あの難しそうなpdfを読むよりもいくらか分かりやすく,GPTなりの考察が得られるので,株式初心者〜中級者には役立つのではないでしょうか.
まとめ
前回のChatGPTを利用した決算短信分析には次のいずれか,もしくは全ての対処法が必要だと結論づけられました.
- 決算短信をpdfではなく,画像として読み込む
- pdfを自力で構造データに落とし込む
- pdf以外のデータソースを見つける
この記事では,そんなところに追加された新機能であるMy GPTsを活用することを考えました.
すると,pdfは全ページ読み込まれているし,文字化けも起こしていないし,というハッピーな結果が得られました.
(おそらくOCRで読み込むように指示したことが効いたのだと思います.しかし,GPTsの追加前にOCRで読み込むように指示したことがあって,その時はOCRに必要な環境がないと言われました.)
初心者向けの内容として申し分なし,だと思うのですが,もう少しいじって改良してみたいと思います.特に,知識としてファイルを工夫してみたいです.