plot
daily follower count
twitter handles
については、私はしようとしています。その結果、あなたは以下を参照してくださいどのようなものが、1つの以上のTwitterのハンドルで絞いる:Start_DateとEnd_Dateを含むPandas Dataframeのプロット数
通常、私は、単に元のテーブルにツイッターから引き出された新しいデータセットを追加することによってこれを行うだろうログが取り出される日付。しかし、これでほんの数日で数百万行になるだろう。そして、それは私がユーザーが落ちたときをはっきりと見ることを許さないでしょう。
Handles:
は私が- のためのフォロワーを引っ張っていたアカウントです:
Follower_ID Handles Start_Date End_Date 100 x 30/05/2017 NaN 101 x 21/04/2017 29/05/2017 201 y 14/06/2017 NaN 100 y 16/06/2017 28/06/2017
:
は
alternative
として、ツイッターからの私のデータを引っ張った後、私はこのように私のpandas dataframe
を構造化Follower_ID:
は、ハンドルに続くユーザーです。
Follower_ID 100
た場合
ので、例えば、私は両方handle x
とhandle y
をたどる可能性があり、私はそれをプロットすることができるようにデータ(pivot
、clean through a function
、groupby
)を調製するための最良の方法だろうかと思っていますそれに応じて。何か案は?
私は何か不足しているかもしれませんが、あなたの例のDataFrameで 'Follower_ID'と' Handles'の意味について詳しく説明できますか?各ハンドルには2つの異なるフォロワーIDがあり、フォロワーID 100には2つの異なるハンドルがあります。 –
@PeterLeimbiglerはい、私は質問を更新してください、申し訳ありませんが、私はこれがどのように混乱するかを見ることができます! –