私はExcelファイルを分析し、データ範囲(最小値、最大値、最小値、最大値、空白など)を調べたいと思っていましたが、これらの洞察を吐き出す新しい解析ファイルを作成します。 「これを行うにはパンダのライブラリに探して。analysis with pandas
df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData')
私が進むべきであるどのように?
私はExcelファイルを分析し、データ範囲(最小値、最大値、最小値、最大値、空白など)を調べたいと思っていましたが、これらの洞察を吐き出す新しい解析ファイルを作成します。 「これを行うにはパンダのライブラリに探して。analysis with pandas
df = pd.read_excel(open('file.xlsx','rb'), sheetname='TestData')
私が進むべきであるどのように?
使用numpyのを関数はいえnumpyのアレイを必要最小/最大値などを取得するにはM、そのいずれかの各列をスライスまたはデータフレームを行列としてキャストする
https://docs.scipy.org/doc/numpy/reference/generated/numpy.argmax.html
あなたが探している統計情報の中には、最小、最大、平均(平均)、標準などがあります。
df = pd.read_excel(r'/path/to/file.xlsx')
In [35]: df
Out[35]:
a b c txt
0 8 5 2 dd
1 6 6 2 aa
2 3 7 9 cc
3 4 2 3 dd
4 3 3 5 cc
In [36]: df.describe()
Out[36]:
a b c
count 5.000000 5.000000 5.000000
mean 4.800000 4.600000 4.200000
std 2.167948 2.073644 2.949576
min 3.000000 2.000000 2.000000
25% 3.000000 3.000000 2.000000
50% 4.000000 5.000000 3.000000
75% 6.000000 6.000000 5.000000
max 8.000000 7.000000 9.000000
:
describe()方法
デモを使用して数値列の偏差