More than 3 years have passed since last update.

Python-MIPのLinExprTensor.astype()をDataFrameの列に追加したときの考察

Last updated at 2022-06-14Posted at 2022-06-14

概要

Python-MIPのLinExprを要素に持つ多次元配列のLinExprTensorを考えます。
このLinExprTensorは、astype(float)により要素をLinExprからfloatに変換してくれます。
ただし、型自体はLinExprTensorのままです。
これをDataFrameの列に追加すると、一見floatの多次元配列に見えて実は異なる型になるので、その説明をします。

説明

まずは、実際のコードを実行して確認してみましょう。
下記の数理モデルは、非負の連続変数が1つで制約条件なしの最小化問題なので自明の最適解（値は0）を持ちますが、解に意味はないです。
型が興味の対象です。

import pandas as pd
from mip import Model

m = Model()
df = pd.DataFrame()
df["Var"] = m.add_var_tensor((1,), "Var")
m.optimize()
df["Val"] = df.Var.astype(float)
print(f"{df.Val.dtype = }")
print(f"{repr(df.Val[0]) = }")
print(f"{repr(df.Val.max()) = }")

出力

df.Val.dtype = dtype('float64')
repr(df.Val[0]) = '0.0'
repr(df.Val.max()) = 'LinExprTensor(0.)'

df.Valは要素がnp.float64のSeriesです¹。
df.Val[0]を確認すると0.0と出力されます。
しかし、df.Val.max()は、0.0にならずにLinExprTensor(0.)と出力されます。
これは、Seriesの内部構造で持つ多次元配列がnp.ndarrayではなくLinExprTensorだからです。type(df.Val.values)とすることで確認できます。
多くの場合、このままでも特に問題になりませんが、ときとして警告が出ることがあります。具体的には下記を実行すると警告がでます。

df.Val.max() == 0

出力

（中略）
FutureWarning: using `dtype=object` (or equivalent signature) will return object arrays in the future also when the inputs do not already have `object` dtype.
  return np.equal(self, other, dtype=object)
LinExprTensor(True)

これを解決するには、下記のようにLinExprTensorをnp.ndarrayに変換すればOKです。

df["Val"] = df.Var.astype(float).to_numpy()
# 下記も同じ
df["Val"] = df.Var.to_numpy().astype(float)

ちなみに、df.Var.astype(float).to_numpy()はnp.ndarrayですが、df.Var.astype(float).valuesはLinExprTensorなので注意しましょう。

以上

import numpy as npを想定しています。 ↩

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up