2017-06-21 11 views
0

私はさまざまな日付のつぶやきを取得し、それらをデータフレームに追加し、最終的にcsvファイルに書き込もうとしています。テキストファイルはつぶやきを追加しますが、dfは上書きされ、csvファイルも上書きされます。 forループを使用してDataFrameを追加するにはどうすればよいですか?

import datetime 
x= datetime.date.today() 
y= x.strftime('%Y-%m-%d') 
c= datetime.date.today() - datetime.timedelta(days=1) 
d= c.strftime('%Y-%m-%d') 
e= datetime.date.today() - datetime.timedelta(days=2) 
f= e.strftime('%Y-%m-%d') 
g= datetime.date.today() - datetime.timedelta(days=3) 
h= g.strftime('%Y-%m-%d') 
i= datetime.date.today() - datetime.timedelta(days=4) 
j= i.strftime('%Y-%m-%d') 
k= datetime.date.today() - datetime.timedelta(days=5) 
l= k.strftime('%Y-%m-%d') 
m= datetime.date.today() - datetime.timedelta(days=6) 
n= m.strftime('%Y-%m-%d') 
o= datetime.date.today() - datetime.timedelta(days=7) 
p= o.strftime('%Y-%m-%d') 

a=[p,n,l,j,h,f,d] 
b=[n,l,j,h,f,d,y] 
for i in range(len(a)): 
    data = Cursor(api.search, q, since=a[i], until=b[i]).items() 
    tweet_data = [] 
    # current_working_dir = os.path.dirname(os.path.realpath(__file__)) 
    current_working_dir = "./" 
    log_tweets = current_working_dir + '_tweets.txt' 
    with open(log_tweets, 'a') as outfile: 
     for tweet in data: 
      tweet_data.append(json.loads(json.dumps(tweet._json))) 
      outfile.write(json.dumps(tweet._json)) 
      outfile.write("\n") 

    print "text file written" 
    # Create the dataframe to be used 
tweets = pd.DataFrame() 
tweets['Tweet'] = map(lambda tweet: tweet['text'].encode('utf-8'), tweet_data) 
tweets['Dates'] = map(lambda tweet: time.strftime('%Y-%m-%d %H:%M:%S', time.strptime(tweet['created_at'],'%a %b %d %H:%M:%S +0000 %Y')), tweet_data) 
tweets['User'] = map(lambda tweet: tweet['user']['screen_name'], tweet_data) 
tweets.to_csv("string.csv", sep=",", index=False) 

print " String CSV written......" 

私のCSVファイルには、それぞれの連続した日付に上書きされます。

は、ここに私のコードです。私はデータフレームを追加しようとしましたが、失敗しました。

答えて

1

Pandas to_csvのデフォルトモードは書き込みです。ファイルを上書きします。追加する適切な方法は、次のようになります。それは兄の作品再び

+0

追加されないように、また、Falseにヘッダーを設定

tweets.to_csv('string.csv', mode='a', header=False, index=False)

。ありがとう、しかし、それはヘッダーを含んでいないので、明示的に列名リストを作成せずにヘッダーを追加し、それをcol_nameを使用してヘッダーに割り当てる方法を教えてください。 – lightyagami96

関連する問題