私はpandasデータフレームオブジェクトとして保存されたファイルの辞書を持っていますが、forループを通して各ファイルにアクセスしています。私がしようとしているのは、これらのそれぞれをリストに抽出してから、リストのリスト全体を取ることです。ここでは、コードと私の苦境がある:pandasオブジェクトをリストのリストに抽出してユニークな値を抽出します
country_setter = []
for file in files_list:
country_setter.append(all_comps[file]['Country'].tolist())
uni_country_setter = ?
結果の出力は、親リストの中にリストを取って、各パンダのDF [「国」]列で、リストのリストです。
[['France',
'United States',
'Poland',
'Poland',
'Poland',
'Poland',
'Hungary',
'Poland',
'France',
'United Kingdom',
....
'Namibia',
'China',
'China',
'Ireland'],
['Netherlands',
'Canada',
'United States',
'Canada',
'Canada',
'United States',
'Sweden',
'Sweden',
'United Kingdom',
....
'Ireland',
'Netherlands',
'Netherlands',
'France',
'Hong Kong',
'France',
'France',
'United States',
'France',
'United States']]
リストには40個のリストがあります。私はセット(country_setter [0])を取ることができ、それは私に最初のリストのユニークな値を得るのにうまく動作しますが、すべてのユニークな値を知る必要があります。ファイルを連動させます。
あなたのお役に立てれば教えてください。私はstackoverflowを徹底的に見てきましたが、わずかに似た質問が1つしか見つかりませんでしたが、目標は固有の抽出でリスト構造を維持し、itertoolsを使用することでした。ここではすべてのリストに一意の値が必要です。
ありがとうございます!
あなたが追加することができますデータサンプル? – jezrael
確かに、私は構造を与えます。 – fattmagan
@jezraelはそれを助けますか? – fattmagan