python pandasでDataFrameの列の分散を計算する

python pandasでDataFrameの列の分散を計算する

pythonで、ライブラリpandasのvarを使用して、DataFrameの列の分散を計算するサンプルコードを記述してます。pythonのバージョンは3.8.5を使用してます。

環境

  • OS windows10 pro 64bit
  • python 3.8.5

pandasインストール

pandasをインストールされていない方は、pipでインストールしておきます。

pip install pandas

# numpyも使用するのでインストールしておきます
pip install numpy

var使い方

varを使用すると、DataFrameの列の分散を計算することが可能です。

import pandas as pd

DataFrame['列名'].var()

以下は、ランダムな値で生成した3行5列のDataFrameの列の分散を計算するサンプルコードとなります。

import numpy as np
import pandas as pd

df = pd.DataFrame(
    np.random.randint(1,10,size=(5, 3)),
    columns=list('123'))

print(df)

#    1  2  3
# 0  6  8  7
# 1  7  3  8
# 2  1  2  5
# 3  4  8  4
# 4  1  2  1

m = df['1'].var()
print ("列1 分散:",m)
# 列1 分散: 7.7

m = df['2'].var()
print ("列2 分散:",m)
# 列2 分散: 9.799999999999999

m = df['3'].var()
print ("列3 分散:",m)
# 列3 分散: 7.5