未初期化の配列を生成するnumpy.empty関数の使い方

np.empty
- params:
- returns:
他の生成関数との比較

NumPyに実装されている関数には、配列を生成するための様々な関数が存在します。その中でもnp.empty関数は、値の初期化を行うことなく配列を生成するものです。

本記事では、NumPyのempty関数の使い方を解説します。

np.empty

配列の生成速度が若干高速になることがあるため、値を0や1で初期化する必要のない場合は、np.emptyを使いましょう。

np.emptyのAPIドキュメントは以下の通りです。

np.empty(shape, dtype=float, order=’C’, like=None)

params:

パラメータ名	型	概要
`shape`	int または intのタプル	生成する配列の形状(shape)を指定します。
`dtype`	dtype	省略可能(初期値float) 生成される配列の要素のデータ型(dtype)を指定します。
`order`	`C`または`F`	省略可能(初期値’C’) 配列のデータの保存の仕方を指定します。
`None`	コレクション	生成されるオブジェクトを`__array_function__`プロトコルを継承しているオブジェクトを指定することができます

returns:

指定されたshapeを持つ、値が初期化されていない配列(ndarray)が返されます。

np.emptyの引数には、第一引数に生成したい配列の形状(shape)を、第二引数にデータ型(dtype)を、そして最後に配列のデータの保存の仕方を指定します。最後の引数は、Fortranのような順序を指定する場合に使われるもので、あまり使用されません。

実際のコードで使い方を見ていきましょう。

In [1]: import numpy as np

In [2]: np.empty(10) # 値を初期化しない１次元配列
Out[2]: array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [3]: np.empty((2, 3)) # shapeを指定する2×3の2次元配列。
Out[3]:
array([[ -0.00000000e+000,   1.29073925e-231,   2.24578104e-314],
       [  2.24578779e-314,  -0.00000000e+000,  -0.00000000e+000]])

次にデータ型を指定していきます。

In [5]: np.empty(5, dtype = np.int8) # dtypeをint8に指定。
Out[5]: array([0, 0, 0, 0, 0], dtype=int8)

In [6]: np.empty(10, dtype = bool) # bool値にすることもできる。
Out[6]: array([False, False, False, False, False, False, False, False, False, False], dtype=bool)

In [7]: np.empty(10, dtype= complex) # 複素数でも生成可能。
Out[7]:
array([0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j, 0.+0.j,
       0.+0.j, 0.+0.j])

他の生成関数との比較

今回は比較対象として要素が0の配列を生成するnp.zerosと要素が1の配列を生成するnp.onesを用います。np.zerosについての詳細は以下のページで解説しています。

0を要素とする配列を生成するnumpy.zerosの使い方 /features/numpy-zeros.html

では、実行速度の比較をしてみます。

  In [15]: %timeit np.zeros(10000)
4.94 µs ± 105 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

In [16]: %timeit np.empty(10000)
1.34 µs ± 14 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)

In [17]: %timeit np.ones(10000)
8.6 µs ± 84.1 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

np.emptyの方が、np.zerosよりも3~4倍程度速いことがわかりますね。また、np.onesとの比較では6倍程度の違いがあります。

実行速度が高速なだけでなく、明示的に初期化する必要がないということを他の人がコードを読んだときに理解してもらうためにも、値を初期化する必要がないときはnp.emptyを使うことをおすすめします。

np.empty

params:

returns:

他の生成関数との比較

DeepAgeではAIに関する厳選した内容を記事にしてお届けします。気に入って頂けたら応援お願いします！

人工知能(AI)技術の事業活用に興味はございませんか？

DeepAgeではAIに関する厳選した内容を記事にしてお届けします。
気に入って頂けたら応援お願いします！

人工知能(AI)技術の事業活用に
興味はございませんか？