2016-10-23 11 views
1

これを理解するのは苦労しています。私は、いくつかのファイルに関連するデータを追跡するプログラムに取り組んでいます。私はパンダを使ってデータを管理し、それをロード/保存しています。最初の実行では、プログラムは拡張子を持つファイルを識別し、各ファイルに関連付けられたデータのいくつかの列を持つpandasデータフレームを作成します。実行時までは列の数と行の数は分かりません。すべてのファイルパスを列に追加するが、DataFrameの他の列はすべて空白にしておきたい。これを行うには良い方法があるのだろうか?入力が[val1, val2, val3,...]であれば、私は、データフレームは任意のヘルプnullの列を持つパンダデータフレームを作成する

[col1, col2, col,...,coln] 
[val1, NaN, NaN,..., NaN] 
[val2, NaN, NaN,..., NaN] 
[val3, NaN, NaN,..., NaN] 

おかげになりたいです!

答えて

2

あなたが辞書からあなたのデータフレームを作成した場合、columnsキーワードに指定された任意の余分な列がnullに初期化されます。

また
In [3]: pd.DataFrame({'col1':['val1','val2','val3']}, 
        columns=['col1','col2','col3']) 
Out[3]: 
    col1 col2 col3 
0 val1 NaN NaN 
1 val2 NaN NaN 
2 val3 NaN NaN 

あなたの最初の列がインデックスされている場合は、この構文を使用することができます。

In [4]: pd.DataFrame([], ['val1','val2','val3'], ['col1','col2','col3']) 
Out[4]: 
    col1 col2 col3 
val1 NaN NaN NaN 
val2 NaN NaN NaN 
val3 NaN NaN NaN 
+0

@piRSquared cool回答に追加します – maxymoo

+0

恐ろしいです!早速のお返事ありがとうございます! – Grimey

関連する問題