を使用して私のために動作しません:合計とGROUPBYは、私は、次のデータセット持っているパンダ
を私はパンダを使用して(名)によってグループ化列cantidad
(量)を合計したいので、私は試してみました:
最初の行は、共通の名前は "アナ" に起因して驚きましたので、私は検査:
さて、 "アナ"の合計は434ではありません。何が起きていますか?私は間違って何をしていますか?列の値は空白を末尾にしたため
を使用して私のために動作しません:合計とGROUPBYは、私は、次のデータセット持っているパンダ
を私はパンダを使用して(名)によってグループ化列cantidad
(量)を合計したいので、私は試してみました:
最初の行は、共通の名前は "アナ" に起因して驚きましたので、私は検査:
さて、 "アナ"の合計は434ではありません。何が起きていますか?私は間違って何をしていますか?列の値は空白を末尾にしたため
あなたはskipinitialspace=True
を必要とする - そう'Ana'
は、' Ana'
、' Ana '
が...別にグループ化されています
historical_names = pd.read_csv('nombres-1920-1924.csv', skipinitialspace =True)
print (historical_names.head())
resume = historical_names.groupby('nombre')['cantidad'].sum()
print (resume['Ana'])
437
a = historical_names.loc[historical_names['nombre'] == 'Ana', 'cantidad']
print (a)
5 113
10340 138
18776 1
23114 183
26523 2
Name: cantidad, dtype: int64
a = historical_names.loc[historical_names['nombre'] == 'Ana', 'cantidad'].sum()
print (a)
437
historical_names = pd.read_csv('nombres-1920-1924.csv')
print (historical_names.head())
historical_names['nombre'] = historical_names['nombre'].str.strip()
resume = historical_names.groupby('nombre')['cantidad'].sum()
print (resume['Ana'])
437
historical_names = pd.read_csv('nombres-1920-1924.csv')
print (historical_names.head())
resume = historical_names.groupby('nombre')['cantidad'].sum()
print (resume['Ana'])
434
a = historical_names.loc[historical_names['nombre'] == 'Ana', 'cantidad']
print (a)
5 113
10340 138
23114 183
Name: cantidad, dtype: int64
a = historical_names.loc[historical_names['nombre'] == 'Ana', 'cantidad'].sum()
print (a)
434
本当に面白いです。 'resume = historical_names.groupby( 'nombre')['cantidad']。sum()'を返すものは何ですか? – jezrael
@jezrael、あなたの興味に感謝します。結果は同じです。あなたは[ここ]からデータセットをダウンロードできます(http://datos.gob.ar/dataset/b8418d41-8e0c-4e85-8aa8-80d51a840132/resource/811bf426-fc36-4f20-b2e1-59bdbb938153/download/nombres-1920- –
@JohnGalt私は私の家に帰るときに追加します。私はdtypesをチェックして、オブジェクト(nombre)、np.int64(cantidad)、np.int64(anio)を取得します –