python pandasでDataFrameの列の分散を計算する
pythonで、ライブラリpandasのvarを使用して、DataFrameの列の分散を計算するサンプルコードを記述してます。pythonのバージョンは3.8.5を使用してます。
環境
- OS windows10 pro 64bit
- python 3.8.5
pandasインストール
pandasをインストールされていない方は、pipでインストールしておきます。
pip install pandas
# numpyも使用するのでインストールしておきます
pip install numpy
var使い方
varを使用すると、DataFrameの列の分散を計算することが可能です。
import pandas as pd
DataFrame['列名'].var()
以下は、ランダムな値で生成した3行5列のDataFrameの列の分散を計算するサンプルコードとなります。
import numpy as np
import pandas as pd
df = pd.DataFrame(
np.random.randint(1,10,size=(5, 3)),
columns=list('123'))
print(df)
# 1 2 3
# 0 6 8 7
# 1 7 3 8
# 2 1 2 5
# 3 4 8 4
# 4 1 2 1
m = df['1'].var()
print ("列1 分散:",m)
# 列1 分散: 7.7
m = df['2'].var()
print ("列2 分散:",m)
# 列2 分散: 9.799999999999999
m = df['3'].var()
print ("列3 分散:",m)
# 列3 分散: 7.5
-
前の記事
nextcloud 投票ツール「Polls」を追加する 2021.09.07
-
次の記事
VBA 斜め線を削除する 2021.09.07
コメントを書く