22
23

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 5 years have passed since last update.

pandas.DataFrame.to_sqlの落とし穴と対処法

Posted at

バッチでデータフレーム型のデータを元に、DB上に仮テーブルを作ったものの
object型のカラムのデータの64文字目以降が勝手に消えていた。
エラーも警告も出なかったのに…なので対処法まとめ。


以下のようなデータを元にDBにテーブルを作るとする(nameは70文字)

sample.csv
name,age
AAAAAAAAAABBBBBBBBBBCCCCCCCCCCDDDDDDDDDDEEEEEEEEEEFFFFFFFFFFGGGGGGGGGG,20
AAAAAAAAAABBBBBBBBBBCCCCCCCCCCDDDDDDDDDDEEEEEEEEEEFFFFFFFFFFGGGGGGGGGG,18
AAAAAAAAAABBBBBBBBBBCCCCCCCCCCDDDDDDDDDDEEEEEEEEEEFFFFFFFFFFGGGGGGGGGG,23
AAAAAAAAAABBBBBBBBBBCCCCCCCCCCDDDDDDDDDDEEEEEEEEEEFFFFFFFFFFGGGGGGGGGG,21

pandasのto_sql関数とmysql.connectorを使った場合

サンプルソース

sample_to_sql.py
import pandas as pd
import mysql.connector
df = pd.read_csv('sample.csv')
table_name = "sample_to_sql"
db_settings = {
    "host": <ホスト名>,
    "database": <データベース名>,
    "user": <ユーザ名>,
    "password": <パスワード>,
    "port":3306
}
con = mysql.connector.connect(**db_settings)
df.to_sql(table_name, con, flavor='mysql', index=False)

結果

スクリーンショット 2016-04-25 17.32.13.png

少しわかりにくいが、nameの64文字目以降が消えている。

テーブル情報を見ると
スクリーンショット 2016-04-25 17.33.39.png

63文字制限になっている…
object型のカラムはvarchar(63)でテーブルを作るようにハードコーディングされていた。
(~~~/site-packages/pandas/io/sql.pyの1310行目あたり)

解決策

上のスクリプトを実行すると、df.to_sqlの部分でこんな警告が出る。

FutureWarning: The 'mysql' flavor with DBAPI connection is deprecated and will be removed in future versions. MySQL will be further supported with SQLAlchemy connectables.

ということで、sqlalchemyのインストール

sudo pip install sqlalchemy

サンプルコード

sample_sqlalchemy.py
import pandas as pd
from sqlalchemy import create_engine
df = pd.read_csv('sample.csv')
table_name = "sample_sqlalchemy"
db_settings = {
    "host": <ホスト名>,
    "database": <データベース名>,
    "user": <ユーザ名>,
    "password": <パスワード>,
    "port":3306
}
engine = create_engine('mysql://{user}:{password}@{host}:{port}/{database}'.format(**db_settings))
df.to_sql(table_name, engine, flavor='mysql', index=False)

この時点でデータフレームの中身にあったテーブルが作られる。
中身を見るとこんな感じ。

スクリーンショット 2016-04-25 17.07.00.png

varcharだったのが、textになっていた。データはきちんと入っている。
スクリーンショット 2016-04-25 17.42.52.png

22
23
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
22
23

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?