0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Pentahoで簡単にAWS S3にアクセスする方法

Last updated at Posted at 2025-05-27

1. はじめに

Pentahoには各種クラウドサービスと連携する機能があります。
この記事ではPentahoを使ってAWS S3 へアクセスする方法を説明します。

Pentahoの使い方については、以下の記事を参考にしてください。

2. 対象読者

PentahoでETLを作成した経験があり、AWS S3へアクセスする方法を知りたい方

3. 事前準備

AWSへの接続情報を格納

AWS への接続情報を <ユーザホームディレクトリ>/.aws/config および <ユーザホームディレクトリ>/.aws/credentials に記載します。今回はAWS ACESS KEY IDAWS SECRET ACCESS KEYを使用して接続します。設定例は以下の通りです。

.aws/config (東京リージョンの場合)
[default]
region=ap-northeast-1
output=json
.aws/credentials
[default]
aws_access_key_id=(ACESS KEY IDを入力)
aws_secret_access_key=(AWS SECRET ACCESS KEYを入力)
aws_session_token=(AWS SESSION TOKEN を必要に応じて入力)

4. AWS S3へのアクセス方法

PentahoからAWS S3にアクセスする方法はいくつかありますが、ここではPentahoのVFS (Virtual File System)機能を使ってアクセスします。
Connecting to Virtual File Systems

4.1 AWS S3へ接続するVFS コネクションの作成

データ変換定義の左ペインの[ビュー]→[VFS Connetions]を右クリック→[New]を選択します。

image.png

表示されたダイアログに設定します。

image.png

# 設定項目 設定内容
1 Connection Name 名前を指定します。VFSのURLに使用しますので、短めな英数字をお勧めします。
2 Authentication Type Credentials Fileを選択します。
3 Region 使用するリージョンを選択します。
4 Profile Name credentialsファイルに記載しているプロファイル名を入力します。今回はdefaultになります。
5 File Location 前述で作成したcredentialsファイルを指定します。
6 Root Folder Path 必須ではありませんが、/<バケット名> を設定しておくと特定のバケットにアクセス範囲を絞れます。

ダイアログを閉じると以下のようになります。
image.png

4.2 AWS S3からテキストファイルを読み込む。

今回はAWS S3に置いてある以下のテキストファイルを読み込みます。
image.png

[テキストファイル入力]ステップの配置

今回はTXTファイルの読み込みのために[テキストファイル入力]ステップ(*)を使用します。

(*)[CSVInput]ステップは[参照]ボタンでVFS Connectionsのダイアログが表示されますが、プレビューや実行ができず、対応していないようです。

image.png

ダイアログの設定

配置した[テキストファイル入力]ステップをダブルクリックしてダイアログを開き、参照ボタンを押します。
image.png

ファイル選択画面で[VFS Connection]を展開してファイルを選択して[Open]を押します。
image.png

ファイル選択画面が閉じた後、[ファイルとダイアログ]にpvfs://~とVFSのURLが設定されています。
[追加]ボタンを押してリストに追加します。
image.png
image.png

このあとはファイルの内容に合わせて以下のような設定を行います。

  • [全般]タブで区切り文字を設定
  • [フィールド]タブで[フィールドを取得]を押しフィールドを自動設定

[プレビュー]を押すとプレビュー画面が表示されます。
image.png

4.3 AWS S3へExcelファイルを書き込む。

今回はAWS S3にExcelファイルを書き込みます。

[Microsoft Excel Writer]ステップの配置

以下のように[Microsoft Excel Writer]ステップを配置して、[テキストファイル入力]ステップから繋ぎます。
image.png

ダイアログの設定

配置した[Microsoft Excel Writer]ステップをダブルクリックしてダイアログを開き、参照ボタンを押します。
image.png

ファイル保存先のダイアログが開くので[VFS Connections]を展開しディレクトリを選択、ファイル名を入力、[Save]をクリックします。
image.png

[ファイル名]にファイルのURLが設定されるので、このまま[OK]をクリックします。
image.png

4.4 データ変換定義の保存

メニューの[ファイル]→[保存]で保存先を指定できます。データ変換定義(ktrファイル)もVFSに保存できます。
image.png

4.5 実行

実行ボタンを押して実行します。
image.png

4.6 実行結果

実行するとAWS S3にファイルが書き込まれます。
image.png

5. まとめ

PentahoのVFS機能を使ってAWS S3にアクセスする方法を紹介しました。この機能を使用してGUIで簡単にAWS S3へ読み書きできることを体験してください。

6. 補足

6.1 VFSの定義情報の保存先

VFSの定義情報はユーザーのホームディレクトリの.pentaho/metastore/pentaho 以下に保存されています。(S3の定義は.pentaho/metastore/pentaho/Amazon S3 Connection以下に保存されています。)

6.2 プロキシ環境下からのAWS S3へのアクセス

Pentaho 10.2はAWS SDKを利用しているようでプロキシ環境下では以下のJavaプロパティを指定することでAWS S3にアクセスできるようです。

  • http.proxyHost
  • http.proxyPort
  • http.proxyUser
  • http.proxyPassword
  • https.proxyHost
  • https.proxyPort
  • https.proxyUser
  • https.proxyPassword

Configure HTTP proxies

他社商品名、商標等の引用に関する表示

  • Amazon Web Services、AWS、Powered by AWS ロゴ は、Amazon.com, Inc. またはその関連会社の商標です。
  • Excel および Microsoft は、マイクロソフトグループの企業の商標です。
  • Pentahoは、Hitachi Vantara LLCの商標または登録商標です。
  • HITACHIは,株式会社 日立製作所の商標または登録商標です。
  • その他記載の会社名,製品名などは,それぞれの会社の商標もしくは登録商標です。
0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?