日向坂46の出演情報を追いきれなくなったので、横断検索ポータルを作った話

Posted at 2026-05-25

はじめに

日向坂46のファンを長年やっていたら、こんな悩みが出てきました。　それは活動を追いきれなくなってきたことです。　

2026年5月時点で、日向坂46には現役メンバーだけで31名。　さらに、20人近くいる日向坂46を卒業したメンバーの大半が芸能活動を再開し、ファンクラブも開設。　嬉しい悲鳴なのですが、芸能活動を追いかけるのは、さすがに厳しくなりました。　記憶力に頼るのはとっくに限界。　

舞台やミュージカルだけを見ても、2026年5〜6月は卒業された加藤史帆さん、佐々木美玲さん、濱岸ひよりさん、富田鈴花さん、松田好花さんと同時期に5人分の情報を追う必要があります。

それに加え、日向坂46にはYouTube公式チャンネルがあります。　キーワードでタイトル検索はできますが、出演メンバー名での検索は当然できません。　そのため「〇〇さんが気に入ったのでおすすめ動画を教えてください」と聞かれても、過去動画は記憶頼みになりがちでした。

そこで、少なくともTV番組・ラジオ番組・YouTube動画を、メンバーの名前で横断的で簡単に検索できる形にしたいと思い、横断検索のポータルサイトを作成しました。

おひさまポータルと名付けて構築・運用しています。

サイト名の由来は、日向坂46のファンの総称で「おひさま」とポータルサイトを掛け合わせて、おひさまポータルとしました。

2つのリポジトリで構成しています。

リポジトリ	役割
`ohisama-backend`	データ収集・加工・API提供
`ohisama-portal`	フロントエンド（Next.js）

YouTube・TVer・Radikoのコンテンツをメンバー・種別・キーワードで横断検索できるポータルサイトです。

主なページ

技術スタック

TVer・YouTube・Radikoからコンテンツを収集・加工し、フロントエンドが利用できるデータとして配信する基盤です。

技術スタック

本システムは ohisama-backend（データ収集・加工）と ohisama-portal（フロントエンド）の2リポジトリで構成されています。

データフローの流れ:

収集: GitHub Actionsが毎日早朝にトリガーし、PlaywrightでTVer・Radikoをスクレイピング、YouTube Data APIでコンテンツを取得
加工: Pythonスクリプトがメンバーや配信日時でデータを整形し、タグを付与してJSONファイルを生成
同期: GitHub Actionsが指定の場所へJSONファイルを自動コミット・プッシュ
配信: Next.jsがJSONをビルド時にimportし、Vercelを通じて静的ページとして公開

TVer・Radikoのスクレイピングは1日1回の定期実行に抑えています。ページ構造の変化やタイムアウトで失敗した場合は、GitHub Actionsの "Re-run jobs" で対応できる構成にしています。

TVer側の公開期限情報は事後的に変動することがあります。そのため、タグの付与は「既存タグを全削除 → 再付与」の方式を採っており、常に最新の状態を反映するようにしています。

JSONファイルをポータルへ同期してから実際にVercelへ反映されるまで、再ビルドのタイムラグ（通常数分）があります。緊急で反映が必要な場合は手動同期ワークフローを実行します。

YouTube動画とその動画に出演している日向坂46のメンバーの紐づけが大変でした。　いろいろ考えた結果、１つずつ動画を見ては誰が出演しているかの設定をひたすら人力することで解決させました。　数百本ありましたが、地道にやって完了させました。