LoginSignup
0
1

More than 3 years have passed since last update.

【データサイエンティスト入門】科学計算、データ加工、グラフ描画ライブラリの使い方の基礎♬環境構築

Last updated at Posted at 2020-08-13

昨夜の【データサイエンティスト入門】Pythonの基礎♬関数とクラスの続きでChapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎 本書にはありませんが環境構築の話をします。
【注意】
「東京大学のデータサイエンティスト育成講座」を読んで、ちょっと疑問を持ったところや有用だと感じた部分をまとめて行こうと思う。
したがって、あらすじはまんまになると思うが内容は本書とは関係ないと思って読んでいただきたい。

Chapter 2 科学計算、データ加工、グラフ描画ライブラリの使い方の基礎

Chapter 2-1 データ分析で使うライブラリ

Mumpy, Scipy, Pandas, Matplotlibの使い方を学びます。

環境構築

Raspi4で構築して行こうと思います。
【参考】
【RasPi4入門】環境構築;OpenCV/Tensorflow、日本語入力♪

まず、これらのライブラリを以下の環境に構築します。
一応のターゲットは、pytho3, numpy, scipy, pandas, matpotlib, jupiter notebookをインストールします。
SDカードに焼いた時点の環境は以下のとおり
つまり、python 3.7.3 numpy 1.16.2がインストールされていました。

環境構築確認
$ python3
Python 3.7.3 (default, Dec 20 2019, 18:57:59) 
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import numpy
>>> print(numpy.__version__)
1.16.2
>>> import scipy
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ModuleNotFoundError: No module named 'scipy'
>>> import pandas
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ModuleNotFoundError: No module named 'pandas'
>>> import matplotlib
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ModuleNotFoundError: No module named 'matplotlib'

ライブラリのインストール

今回は依存関係はnumpy-scipy以外はなさそうですが、一応、以下の順番に入れました。
以下のapt-getコマンドだと、非常に短時間(全部で10分程度)でインストールできました。

$ sudo apt install jupyter-notebook

$ sudo apt-get update
$ sudo apt-get upgrade

$ sudo apt-get install python3-matplotlib

$ sudo apt-get install python3-scipy

$ sudo apt-get install python3-pandas
ライブラリの確認

とりあえず、以下のとおりインストールできたようです。

$ python3
Python 3.7.3 (default, Jul 25 2020, 13:03:44) 
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> import scipy
>>> print(scipy.__version__)
1.1.0
>>> import pandas
>>> print(pandas.__version__)
0.23.3
>>> import matplotlib
>>> print(matplotlib.__version__)
3.0.2

Chapter 2-1-1 ライブラリの読み込み

プログラムからのライブラリの読み込みの構文は代表的なものは以下の二つです。

(1) import モジュール名 as 識別名
例;import numpy as np
numpy モジュールの中で定義されている、関数(機能)をnp.機能という形で使えるようになります。
(2) from モジュール名 import 属性
例;from numpy import random
こちらも同様で、numpyの中のrandomを呼び出して、さらに定義されている機能をrandom.機能として使えるようになります。

Chapter 2-1-2 マジックコマンド

Jupyter notebookので利用する%orecision %matplotlib などの解説ですが、使わないので省略します。
なお、 %quickrefでRunするとコマンド出てきます。

Chapter 2-1-3 この章で使うライブラリのインポート

something.py
import numpy as np
import numpy.random as random
import scipy as sp
import pandas as pd
from pandas import Series, DataFrame

import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns

#%matplotlib inline
#%precision 3

上記をpython something.pyとして実行してみると、以下のエラーがでます。

ModuleNotFoundError: No module named 'seaborn'

seabornをインストールします。
5秒でインストールできました。

$ pip3 install seaborn
...
Successfully installed seaborn-0.10.1

これで、エラーも消えました。

まとめ

・Raspi4に必要なライブラリを一からインストールした
・apt-getでインストールすると全部で10分程度で完了できた
・参考のとおりだけど、WiFi設定と日本語化の設定にてこずりました

・明日は、やっとそれらしい内容になるかな??

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1