論文情報
- 著者: J Russell, M Karpinska, D Akinode, K Thai
- 論文概要リンク: https://arxiv.org/abs/2510.18774
- 論文PDFリンク: https://arxiv.org/pdf/2510.18774?
要約
本論文は2025年夏にアメリカの1500紙の新聞から収集した約186,000記事を対象に、最先端のAI検出ツールPangramを用いて、新聞記事におけるAI利用の実態を大規模に分析したものである。結果、約9%の記事が部分的または完全にAI生成されており、その利用状況は地方紙で顕著かつ特定のトピックや出版グループに偏っていることが明らかとなった。さらに著名な新聞社の意見記事におけるAI利用はニュース記事よりも6.4倍多いが、その多くが開示されていないことも判明し、透明性確保の必要性が強く示唆されている。
主要なポイント
- 約9%の新聞記事が部分的または完全にAI生成されているが、AI利用の開示は極めて稀である。
- AI利用は地方紙、小規模な発行部数の新聞で高く、特に天気、科学技術、健康分野で多い。
- 一流新聞の意見記事ではAI利用率が急増し、政治家や有名ゲスト寄稿者など著名な執筆者の作品にも多く見られる。
- AI活用は言語によって偏りがあり、英語以外(特にスペイン語)でより高頻度に利用されている。
- 長期にわたる調査から、ChatGPT登場以降、特定の記者によるAI利用率が2023年以降急増しているが、利用開示は皆無である。
メソッド
- データセット構築:2025年6月〜9月の約186,000記事「recent_news」、2022年8月〜2025年9月のトップ3紙の約45,000の意見記事「opinions」、ChatGPTリリース前後の記事を含む10人記者の20,000記事「ai_reporters」の3つを収集。
- AI検出:Pangram APIを用い、記事ごとにAI生成の可能性を0–100%で評価し、「人間書き」「混合(部分AI)」「AI生成」の3分類を付与。GPTZeroとの比較でも高精度かつ安定性を確認。
- トピック分類:IPTCメディアトピック17カテゴリにQWEN3-8B言語モデルでゼロショット分類し、モデルと人間の判定一致率は約77%。
- 出版社の発行部数・所有情報を米国News Desertsデータベースから統合し、AI利用の分布を解析。
- 引用文のAI生成率も個別に検査し、AI生成引用の有無を記事ごとに集計して著作の信頼性分析も実施。
意義・影響
- 本研究は米国新聞記事におけるAI文生成の大規模かつ詳細な実態調査として初の包括的な分析を提供し、ジャーナリズムにおけるAI利用の偏在性と透明性欠如を実証的に示した。
- AI利用の一層の増加が予想される中で、誤情報やバイアスの導入リスクと公衆の信頼維持に関わる重要な課題を浮き彫りにしている。
- 意見記事など意思形成に大きな影響を持つ領域へのAI導入が特に顕著であり、AI利用開示の義務化や編集方針の整備が必要とされる。
- 報道機関向けに、AI利用の許容範囲の明確化、著者によるAI使用申告義務化、編集部によるAIチェック導入などの政策的提言が示されている。
- 研究資産として大規模データセット・解析コード・インタラクティブ・ダッシュボードを公開し、今後の追跡調査やガバナンス研究に資する基盤を築いた。
長文かつ多角的な分析を含むため、図表で示される州別AI利用率マップやトピック毎のAI利用割合、出版グループ別ヒートマップ、年次でのAI利用増加推移グラフなどの視覚資料が理解支援に寄与している点も重要です。