Troubleshoot sharing and accessing data using Delta Sharing | Databricks on AWS [2022/4/6時点]の翻訳です。
本書は抄訳であり内容の正確性を保証するものではありません。正確な内容に関しては原文を参照ください。
共有(share)内のデータへのアクセス
share内のデータにアクセスする際に以下のエラーが起こることがあります。
File not foundあるいはcertificateのエラー
問題: ファイルが見つからない、あるいは証明書の例外を示すエラーに遭遇する。
可能性のある原因: お使いのバケット名でドット、あるいはピリオドを使用している。これはAWSの制限です。Amazon S3 Path Deprecation Planをご覧ください。
推奨する修正案: Unity CatalogとDelta Sharing向けに別のバケットを使う。
Sparkのエラー例:
FileReadException: Error while reading file delta-sharing:/%252Ftmp%252Fexample.share%2523example.tpc_ds.example/XXXXXXXXXXXXX/XXXXXXXX.
Caused by: SSLPeerUnverifiedException: Certificate for - <[workspace name].cloud.databricks.com.s3.us-east-1.amazonaws.com> doesn't match any of the subject alternative names [s3.amazonaws.com, *.s3.amazonaws.com…]:
Pandasのエラー例:
FileNotFoundError(path)
FileNotFoundError: https://xxxx.xxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxx/part-00000-xxxxx-Amz-Algorithm=Axxxxxx-Amz-Date=xxxxxxxx&X-Amz-SignedHeaders=host&X-Amz-Expires=xxx&X-Amz-Credential=xxxxxxx_request&X-Amz-Signature=xxxxx
Power BIのエラー例:
DataSource.Error: The underlying connection was closed: Could not establish trust relationship for the SSL/TLS secure channel.
Details:
https://xxxx.xxxxxxxxx.s3.xx-xxxx-1.amazonaws.com/xxxxxxxx/part-00000-xxxxxxx.snappy.parquet