python pandasでDataFrameの列の標準偏差を計算する

python pandasでDataFrameの列の標準偏差を計算する

pythonで、ライブラリpandasのstdを使用して、DataFrameの列の標準偏差を計算するサンプルコードを記述してます。pythonのバージョンは3.8.5を使用してます。

環境

  • OS windows10 pro 64bit
  • python 3.8.5

pandasインストール

pandasをインストールされていない方は、pipでインストールしておきます。

pip install pandas

# numpyも使用するのでインストールしておきます
pip install numpy

std使い方

stdを使用すると、DataFrameの列の標準偏差を計算することが可能です。

import pandas as pd

DataFrame['列名'].std()

以下は、ランダムな値で生成した3行5列のDataFrameの列の標準偏差を計算するサンプルコードとなります。

import numpy as np
import pandas as pd

df = pd.DataFrame(
    np.random.randint(1,10,size=(5, 3)),
    columns=list('123'))

print(df)

#    1  2  3
# 0  5  6  6
# 1  8  5  7
# 2  4  1  7
# 3  5  1  5
# 4  5  8  1

m = df['1'].std()
print ("列1 標準偏差:",m)
# 列1 標準偏差: 1.51657508881031

m = df['2'].std()
print ("列2 標準偏差:",m)
# 列2 標準偏差: 3.1144823004794877

m = df['3'].std()
print ("列3 標準偏差:",m)
# 列3 標準偏差: 2.4899799195977463