3つのCSVファイル（多言語）からメガトレンドを抽出し、Gemini APIで英訳しワードクラウドとバブルチャートを生成しました

Posted at 2025-08-02

これは何？

RSSで集めた「任意のキーワード有り」「無し」と「多言語」の3つのCSVファイルを読み込み、言語圏ごとの温度感を視覚化しました。（隠れた予兆のパターンなどはAIをお勧めします）

→ analysis_debug.txt
これは図だけでは過程が分からないので、確認用のテキストファイルです

英語で出来るだけRSSを集めたことと、中国語と韓国語のRSSの取得が困難だったこと、ロシア語は英語で集めたことなど、RSSの取得に偏りがあります。日本語の情報源も、一例です。MITライセンスなので、ライセンスの範囲で改変してご利用下さい。

langdetectで、CSVの情報を言語ごとに振り分けられます。正規表現でやるより正確かと。

janomeとストップワードで、名詞・固有名詞を抽出しています。再利用出来るかもしれません。

最後までお読み下さりありがとうございます。