More than 5 years have passed since last update.

Pythonの組み込み関数69個を制覇する第5回 l～o

Last updated at 2019-12-30Posted at 2019-12-29

Pythonでは、非常に多くの組み込み関数(Built-in Functions)が用意されており、ライブラリをimportせずとも様々な処理を行うことができます。
基本に立ち返って、組み込み関数の使い方を整理して行きたいと思います。
j, kから始まる組込み関数は現在のところないので、第5回はlからの開始です。

尚、実行例はWindows Subsystem for Linux 2 (WSL2)のUbuntu18.04にインストールしたPython3.7.5で作成しています。

(注意事項)
更新の期間が空いた結果、前回までの記事とPythonのマイナーバージョンおよび実行環境が異なっていますのでご注意ください。
また、執筆時現在、Python3.8.0がリリースされていますが、本シリーズではPython3.7系での記述を行っていますので、そちらも留意いただければと思います。

Pythonの組み込み関数69個を制覇する第1回 a～b
Pythonの組み込み関数69個を制覇する第2回 c～d
Pythonの組み込み関数69個を制覇する第3回 e～g
Pythonの組み込み関数69個を制覇する第4回 h～i
Pythonの組み込み関数69個を制覇する第6回 p～r

関数の使い方

各関数の使い方を記述していきます。詳細な使い方は他の記事に譲るとして、ここでは簡単な使用例を中心に掲載していきます。

len()

渡したオブジェクトの持つ要素の個数を返却します。
引数に渡せるのは、文字列、リストやタプルなどのシーケンスや、辞書・セットなどのコンテナです。

>>> # 文字列型
... len('The quick brown fox jumps over the lazy dog')
43
>>> # リスト
... len(['fox', 'dog', 'otter', 'cat'])
4
>>> # タプル
... len((1, 1, 2, 3, 5, 8, 13, 21, 34, 55,))
10
>>> # 辞書
... len({'Hello': 'World', 'Good bye': 'World'})
2
>>> # セット
... len({2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31})
11
>>> # rangeオブジェクト
... len(range(100))
100 
>>> # `__len__` を実装すると長さを取得できる
...  class Stock(object):
...     def __init__(self, data):
...         self._data = data
...     def __len__(self):
...         return len(self._data)
...
>>> stock = Stock({'orange': 10, 'strawberry': 3, 'melon': 5})
>>> len(stock)
3

ちなみに、CPythonの実装では、lenの上限はsys.maxsize以下に制限されています。

>>> class MaxLen(object):
...     def __len__(self):
...         return sys.maxsize
...
>>> len(MaxLen())
9223372036854775807
>>> class OverMax(object):
...     def __len__(self):
...         return sys.maxsize + 1
...
>>> # sys.maxsizeを超えるとエラーになる
... len(OverMax())
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
OverflowError: cannot fit 'int' into an index-sized integer

実際にはmaxsizeのリストを作ろうとするとメモリが足りなくなりました。

>>> [1] * sys.maxsize
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
MemoryError
>>> l = [1 for i in range(sys.maxsize)]
# メモリ不足でWSL2が落ちた

MemoryErrorになるか、もしくは落ちるかは環境によって異なるようなので、気になる方は安全に配慮した上で試してみてください。以前私がWSL1で試した際には、後者の例で segmentaiton fault が発生しPythonがエラー終了しました。

list()

リスト型のオブジェクトをつくって返却します。
引数には、シーケンス、イテレーション可能なオブジェクト、イテレータを渡すことができます。

>>> # 引数なしなら要素のない空リスト
... list()
[]
>>> # 文字列
... list('curry and rice')
['c', 'u', 'r', 'r', 'y', ' ', 'a', 'n', 'd', ' ', 'r', 'i', 'c', 'e']
>>> # リスト
... list(['Mystery', 'SF', 'Fantasy', 'Romance'])
['Mystery', 'SF', 'Fantasy', 'Romance']
>>> # タプル
... list(('Classic', 'Rock', 'R&B', 'Jazz',))
['Classic', 'Rock', 'R&B', 'Jazz']
>>> # range
... list(range(1, 10, 2))
[1, 3, 5, 7, 9]
>>> # 辞書
... list({'Harry': 'Potter', 'Ron': 'Weasley', 'Draco': 'Malfoy'})
['Harry', 'Ron', 'Draco']
>>> # イテレータ
... list(iter(functools.partial(random.randint, 1, 10), 5))
[10, 3, 7, 2, 3, 9, 4, 4, 7, 1, 10, 8, 7, 1, 3, 3, 10, 2, 6, 4]

listオブジェクト生成のタイミングでイテレータの評価が行われます。


>>> m = map(int, "1 2 3 4 5".split())
>>> next(m)
1
>>> next(m)
2
>>> list(m)
[3, 4, 5]
>>> # イテレータの要素がすべて消費されたので、StopIterationになる
... next(m)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

locals()

呼び出されたローカルな名前空間におけるローカル変数と値のマッピングを返却します。

>>> locals()
{'__name__': '__main__', '__doc__': None, '__package__': None, '__loader__': <class '_frozen_importlib.BuiltinImporter'>, '__spec__': None, '__annotations__': {}, '__builtins__': <module 'builtins' (built-in)>}

対話コンソール上で呼び出した場合は、グローバル変数と同じになります。

>>> locals() == globals()
True

関数内では関数ローカルな値の一覧を返します。


>>> def locals_in_func(*args, **kwargs):
...     a = 1
...     b = 2
...     c = args[:]
...     d = kwargs
...     def _local_func():
...         return 100
...     f = lambda x: 'Paw!'
...     return locals()
...
>>> from pprint import pprint
>>> pprint(locals_in_func(1, 2, 3, 4, **{'Tissue': 'Paper', 'Toilet': 'Paper'}))
{'_local_func': <function locals_in_func.<locals>._local_func at 0x7efecffa0dd0>,
 'a': 1,
 'args': (1, 2, 3, 4),
 'b': 2,
 'c': (1, 2, 3, 4),
 'd': {'Tissue': 'Paper', 'Toilet': 'Paper'},
 'f': <function locals_in_func.<locals>.<lambda> at 0x7efecffb5050>,
 'kwargs': {'Tissue': 'Paper', 'Toilet': 'Paper'}}

map()

関数とイテラブルを引数にわたすと、イテラブルの各要素に関数を適用するmapオブジェクトというイテレータを返却します。
リストの要素を一括で処理したい場合などに便利です。

>>> # 返り値はmapオブジェクト
... map(str, range(10, 0, -2))
<map object at 0x7f2aaf3234e0>
>>> # rangeの各要素を文字列化する
>>> for i in map(str, range(10, 0, -2)):
...     print(i)
...
10
8
6
4
2
>>> # リストの全要素を二乗する
... [i for i in map(lambda x: x * x, [1, 2, 3, 4, 5])]
[1, 4, 9, 16, 25]
>>> list(map(lambda x: x * x, [1, 2, 3, 4, 5]))
[1, 4, 9, 16, 25]
>>> # ユニコードのコードポイントを文字列に変換する
... list(map(chr, [8593, 8593, 8595, 8595, 8592, 8594, 8592, 8594, 66, 65]))
['↑', '↑', '↓', '↓', '←', '→', '←', '→', 'B', 'A']
>>> # 複数の引数を取る関数の場合、必要な引数の数だけiterableを渡す
... for xy in map(lambda x, y: x * y, (1, 2, 3, 4, 5), (1, 10, 100, 1000, 10000)):
...     print(xy)
...
1
20
300
4000
50000

map()に渡した関数は、各要素の呼び出し時に評価されます。

>>> def echo_twice(arg):
...     print(arg, arg)
...
>>> m = map(echo_twice, ['Sunday', 'Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday'])
>>> next(m)
Sunday Sunday
>>> next(m)
Monday Monday
>>> next(m)
Tuesday Tuesday
>>> next(m)
Wednesday Wednesday
>>> list(m)
Thursday Thursday
Friday Friday
Saturday Saturday
[None, None, None]

next()が呼ばれたタイミングで対象の要素が表示されるので、各関数は呼び出し時に評価されることがわかります。

max()

渡された引数の中の最大値を返却します。
引数は一つ以上の任意個の値を渡すことが可能です。ただし、引数の個数が一つの場合はイテラブルである必要があります。

>>> max(5, 2, 4, 1, 6, 0)
6
>>> numbers = [2, 5, 3, 1, 29, 0, -345]
>>> max(numbers)
29
>>> # 文字列も最大値をとれる
... max(['m', 'A', 'x'])
'x'
>>> # リストの最大値
... max([1, 3, 5], [2, 4, 6], [-3, -2, 10])
[2, 4, 6]
>>> # 数値と文字列
... max(1, 3, 7, 'S', 't', 'r')
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: '>' not supported between instances of 'str' and 'int'
>>> # 引数が一つの場合はiterableでないといけない
... max(10000)
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: 'int' object is not iterable

引数にiterableを渡すパターンでは、中身が空の要素を渡した場合はエラーが発生します。
default引数を使うことで、空の場合の返り値を定義することができます。

>>> # 空の場合の挙動を定義できる
... max([], default=100)
100
>>> #  defaultを指定せずに空のiterableを渡すとエラーになる
... max([])
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
ValueError: max() arg is an empty sequence

max()関数は list.sort() や sorted() 関数と同様、key引数を渡すことができます。max()は各要素にkey引数に指定された関数を適用し、その結果を最大値取得のためのソートに利用します。
key引数は、リストの各要素を受け取り、ソートに使う要素を返却するような関数オブジェクトです。
key引数の使い方は、ソート HOW TO が参考になります。

>>> max(-10, -20, -100000, key=abs)
-100000

最大値を取得するためには、比較を行う各要素間で __lt__() メソッドと__eq__() メソッドがサポートされていれば十分なので、自作クラスでの最大値を定義することもできます。

>>> # 自分で定義したクラス
... class Grade:
...     def __init__(self, point):
...         self.point = point
...     def __lt__(self, other):
...         return self.point < other.point
...     def __eq__(self, other):
...         return self.point == other.point
...     def __repr__(self):
...         return str(self.point)
...
>>> students = {'John': Grade(35), 'Jessy': Grade(85), 'Jack': Grade(0)}
>>> # Gradeが最大となる要素を取得する
... max(students.items(), key=lambda x: x[1])
('Jessy', 85)

memoryview()

与えられたオブジェクトのメモリビューオブジェクトを作成して返却します。
メモリビューを利用することで、値のコピーをすることなく下層のメモリ配列などの内部データへのアクセスをすることができます。
メモリビューを作成するためには、対象のオブジェクトがバッファプロトコルをサポートしている必要があります。例えば、bytesやbytearray、標準ライブラリのarray.arrayなどがバッファプロトコルをサポートしています。

>>> # bytes型へのメモリビュー
... m = memoryview(b'Hello,World')
>>> m
<memory at 0x7fb4033fae20>
>>> m.itemsize
1
>>> # bytes型は読み取り専用
... m.readonly
True
>>> # readonly = True なので、書き込みはできない
... m[0] = 71
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: cannot modify read-only memory
>>> m.nbytes
11
>>> m.tolist()
[72, 101, 108, 108, 111, 44, 87, 111, 114, 108, 100]
>>> m.tobytes()
b'Hello,World'

>>> # bytearray型へのメモリビュー
... original = bytearray(b'Hello,World')
>>> ba = memoryview(original)
>>> ba.readonly
False
>>> # readonly = False なので書き込みが可能
... ba[0] = 71
>>> ba.tobytes()
b'Gello,World'
>>> # 元のbytearrayも書き換えられている。
... original
bytearray(b'Gello,World')

memoryviewクラスはcastメソッドをもっており、バイト列の値を読み替えできます。

>>> import array
>>> # unsigned short の arrayを生成
... us = array.array('H', [2**16-1])
>>> us
array('H', [65535])
>>> mv_us = memoryview(us)
>>> mv_us.hex()
'ffff'
>>> mv_us.tolist()
[65535]
>>> # unsigned char型の配列に変換
... mv_uc = mv_us.cast('B')
>>> mv_uc.tolist()
[255, 255]
>>> # signed short の配列に変換
... mv_ss = mv_uc.cast('h')
>>> mv_ss.hex()
'ffff'
>>> mv_ss.tolist()
[-1]

もとの配列の要素の値は65535でしたが、C言語でいうところのunsigned char型の配列を介して、強制的にsigned short型(16bit)で解釈させることで、Pythonのリストに変換すると-1になってしまいました。hex()関数からわかるように、メモリ上の値は変わっていません。

min()

max()関数と同じ構造になっており、渡された引数の中の最小値を返却します。
引数は一つ以上の任意個の値を渡すことが可能です。ただし、引数の個数が一つの場合はイテラブルである必要があります。

>>> min(5, 2, 4, 1, 6, 0)
0
>>> numbers = [2, 5, 3, 1, 29, 0, -345]
>>> min(numbers)
-345
>>> min(['m', 'A', 'x'])
'A'
>>> min([1, 3, 5], [2, 4, 6], [-3, -2, 10])
[-3, -2, 10]
>>> min(1, 3, 7, 'S', 't', 'r')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: '<' not supported between instances of 'str' and 'int'
>>> min(10000)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'int' object is not iterable

key引数でソートの値を指定できる点、default引数でイテラブルが空の場合の返却値を定義できる点もmax()と同じ構造です。

>>> min([], default=-1)
-1
>>> min([])
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: min() arg is an empty sequence
>>> min(-10, -20, -100000, key=abs)
-10

next()

引数にイテレータオブジェクトを渡すと、 __next__() メソッドを呼び出して次の要素を一つ返却します。
返却できる値がない場合は、第2引数に指定したデフォルト値を返します。
デフォルト値が指定されていない場合はStopIteration例外を送出します。

>>> # rangeオブジェクトをイテレータ化する
... it = iter(range(3))
>>> next(it)
0
>>> next(it)
1
>>> next(it)
2
>>> next(it)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration
>>> # default値を指定する
... next(it, 1000000)
1000000
>>> next(it, 1000000)
1000000
>>> # キーワードでは指定できない
... next(it, default=1000000)
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
TypeError: next() takes no keyword arguments
>>> # ジェネレータ式
... gen = (c for c in 'Sword')
>>> next(gen)
'S'
>>> next(gen)
'w'
>>> next(gen)
'o'
>>> next(gen)
'r'
>>> next(gen)
'd'
>>> next(gen)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

object()

Pythonを構成する最も基本的なオブジェクトを生成して返却します。
objectはすべてのクラスのベースクラスです。

>>> # 新しいobjectインスタンスを生成する
... ob = object()
>>> # すべてのクラスはobjectのサブクラス
... issubclass(object, int)
False
>>> issubclass(int, object)
True
>>> class MyClass: pass
...
>>> issubclass(MyClass, object)
True
>>> # object自身もobjectのサブクラスと判定される
... issubclass(object, object)
True
>>> # objectは __dict__ メソッドを持たないので、属性をもてない
... ob.hoge = 'fuga'
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
AttributeError: 'object' object has no attribute 'hoge'

oct()

引数に整数を渡すと、頭に"0o"のついた 8進数表現の文字列として変換してくれます。整数型ではなく、文字列を返すところに注意してください。結果はPythonの式としてeval()で評価可能です。

>>> oct(0)
'0o0'
>>> oct(7)
'0o7'
>>> oct(8)
'0o10'
>>> oct(63)
'0o77'
>>> eval(oct(63))
63

open()

引数に渡した名前のファイルを開き、ファイルの読み書きを行うファイルオブジェクトを返却します。
第2引数に渡すmodeの値によって、生成されるファイルオブジェクトの挙動が変わります。
モードは文字列で、読み込み(r)か書き込み(w, x, a)か、および、テキストかバイナリか(t, b)の2軸で決まります。デフォルトでは、テキストの読み込みモードでファイルを開きます。

>>> # r(読み込み)では、指定したファイルが存在しない場合エラーになる。
... file1 = open('test.txt', 'r')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
FileNotFoundError: [Errno 2] No such file or directory: 'test.txt'
>>> # w(書き込み)では、指定したファイルが存在しない場合作成される
... file1 = open('test.txt', 'w')
>>> file1.write('New file')
8
>>> file1.close()
>>> file1
<_io.TextIOWrapper name='test.txt' mode='w' encoding='UTF-8'>
>>> # ファイルが作成されたので読み込みが可能になった
... file1 = open('test.txt', 'r')
>>> file1.read()
'New file'
>>> file1.close()
>>> # 排他書き込み(x)では、ファイルが存在したらエラーになる
... file1 = open('test.txt', 'x')
Traceback (most recent call last):
  File "<stdin>", line 2, in <module>
FileExistsError: [Errno 17] File exists: 'test.txt'
>>> # 追記書き込み(a)では、ファイルの末尾に書き込みを行う
... file1 = open('test.txt', 'r')
>>> file1.read()
'New file'
>>> file1.close()
>>> file1 = open('test.txt', 'a')
>>> file1.write('\nHello, Hello')
13
>>> file1.close()
>>> file1 = open('test.txt', 'r')
>>> file1.read()
'New file\nHello, Hello'
>>> file1.close()
>>> # 書き込み(w)では、ファイル内容が上書きされる
... file1 = open('test.txt', 'w')
>>> file1.write('New Line!!!')
11
>>> file1.close()
>>> file1 = open('test.txt', 'r')
>>> file1.read()
'New Line!!!'

モードに b を付加することでバイナリファイルも読み込むことができます。

$ ls
ichi_taro3.png
$ python3
Python 3.7.4 (default, Jul 12 2019, 20:57:46)
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> # pngファイルの中身をバイナリモードで読んでみる
... picture = open('ichi_taro3.png', 'rb')
>>> data = picture.read()
>>> data[:20]
b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x01\x90'
>>> picture.close()
>>> # 無理にテキストモードで開こうとすると
... picture = open('ichi_taro3.png', 'rt')
>>> content = picture.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/linuxbrew/.linuxbrew/bin/../Cellar/python/3.7.4/lib/python3.7/codecs.py", line 322, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x89 in position 0: invalid start byte

open() で返されるファイルオブジェクトはコンテキストマネージャを備えており、with文内でopen()を使うことで、withブロックを抜けたタイミングでファイルが自動でクローズされます。通常ファイル操作する場合は、with文とともに利用することがオススメです。
コンテキストマネージャ型

>>> with open('test.txt', 'r') as file1:
...     file1.read()
...
'New Line!!!'
>>> # withブロックを抜けてcloseされたファイルは読めない。
... file1.read()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: I/O operation on closed file.

ord()

一文字のUnicode文字を与えると、Unicodeのコードポイントを整数で返却します。
ちょうど、chr()関数の逆の動きです。

>>> ord('A')
65
>>> ord('Æ')
198
>>> ord('Д')
1044
>>> ord('へ')
12408
>>> ord('嵐')
23888
>>> ord('🌝')
127773
>>> chr(ord('🌝'))
'🌝'

第6回に続く

次回は pow() から

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up

Pythonの組み込み関数69個を制覇する 第5回 l～o