背景
aws glueのcrawlerでファイルをcrawlすると、テーブルに思いもよらぬ名前がつけられることがあるかと思います
プレフィックスで対応できると良いのですが、そうもいかない場合も多いかと思います
今回その状況になって、思ったよりも素直に対応できなかったので、その方法を残しておきます
なお、コンソールからは見つけることが出来ませんでした
google先生にお聞きするとHow set name for crawled table?の記事がヒットしました
(Geminiの回答はいけてませんでした)
初め見た時は、create_tableとあったので、新規にテーブルを作りたいんじゃないけどって思いましたが、元テーブルのメタ情報を引き継いで新しい名前のテーブルを作るので、これで大丈夫ですね
年月がかなり経っていますのでそのままではエラーになりましたが、1箇所の修正とCrawlerの設定変更で対応できました
対応内容
その1
get_tableで取ってきたtable_inputからキーをpopしている箇所で、下のVersionIdを追加
table_input.pop("VersionId")
その2
Crawlerの設定変更
Crawl結果のマッピング先をリネームしたテーブルにして(Not YetからYesに)
一番下のupdate〜のチェックボックスを外す必要がありました
こちらの操作は謎ですが、エラーになりましたので一旦外しました
必要に迫られたらAthenaクエリ等々から設定することにします
こちらの投稿が何方かのお役に立つと嬉しく思います