まとめ
今回のエラーは、学習元のpdfに対応するtxtファイルがないか、あっても期待する形式でないようです。
また、iniについては、記事中にサンプルがあるので、改めて記事を確認してください。
機械学習に詳しくないということで、気になっている点が1つあります。
このコードは、「教師あり学習」というものを、学習元データの学習から行っています。
そのため、0から学習元データを作成・準備するとなると骨が折れそうですが大丈夫そうでしょうか?
場合によっては学習済みのモデルを探し、予測だけを行う方がいいかもしれません。
詳細
KeyErrorは辞書に該当のキーが無い時に発生するエラーです。
参考: https://docs.python.org/ja/3.13/library/exceptions.html#KeyError
エラー自体は、元記事の以下のコードで発生していると思われます。
ini.read(ini_file, 'UTF-8')
label = ini["RootSection"]["LABEL"]
これは @george333 さんのわからないと記載されているポイントの通り、iniファイルに問題があるようです。
以下のコード・文章を見ると、pdf毎に、iniファイルと、1枚目のgifを保存しているようです。
PDFの1ページ目を画像フォーマットで保存する
画像の向きを検出したラベル値をINIファイルに保存して
for pdf_file in files:
ini_file = pdf_file + ".txt" # ~~~~.pdf.txt
img_file = pdf_file + ".gif" # ~~~~.pdf.gif
ini = configparser.ConfigParser()
ini.read(ini_file, 'UTF-8')
label = ini["RootSection"]["LABEL"] # 教師データあり、ラベル情報読み込み
ということであるディレクトリに、学習元のpdfと、それに紐づく設定、そして表紙の画像を一定のルールで準備する必要がありそうです。
例えば、対象のpdfをexample.pdf
とすると以下の3ファイルが必要です。
example.pdf
example.pdf.txt
example.pdf.gif
以上より、今回のエラーは、pdfに対応するtxtファイルがないか、あっても期待する形式でないようです。