LoginSignup
10
22

More than 5 years have passed since last update.

[Linux][Python][Pandas] Microsoft Accessのデータベース(*.mdb)をPandasで読み込む

Last updated at Posted at 2016-08-02

Microsoft Access (*.mdb) のデータを読み込んで解析したい機会があったのでメモ
基本的には pandas_access を使用すれば良かった。

jbn/pandas_access: A tiny, subprocess-based tool for reading a MS Access database (.rdb) as a Pandas DataFrame.

※mdbtoolsのWindowsでの動作確認ができていないため、これはLinux限定の記事になります。

実行手順

mdbtoolsのインストール

pandas_access は mdbtools のラッパーのようなものらしいので、mdbtoolsが必須。

brianb/mdbtools: MDB Tools - Read Access databases on *nix

mdbtoolsのインストール(Ubuntu)
$ sudo apt-get install mdbtools

pandas_acccessの使用

jbn/pandas_access: A tiny, subprocess-based tool for reading a MS Access database (.rdb) as a Pandas DataFrame.

pandas_accessのインストール
$ pip install pandas_access

以下実装例

実装例
import pandas as pd
import pandas_access as mdb

# mdb から dataframe の取得
df = mdb.read_table("DB.mdb", "MyTableName")

上記の用に read_table をすれば Dataframe が取得できるので、あとは通常のpandasの手順で解析を行える

補足

ソースを見ればわかるが、read_tablepandas.read_csv のラッパーなので、第三引数以降に read_csv と同じ引数を使用することができる。read_csv で使用できる引数は以下などを参照。

Pythonコーディング備忘録 ~その3~(pandasのread_csvを使いこなす) - 自調自考の旅

10
22
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
22