一つの方法は、リシェイプが値が正確な順序
df = pd.DataFrame(np.reshape(df.values,(len(df)//3,3)))
df.columns = ['Time', 'Name', 'URL']
Time Name URL
0 6/10/2017 8:40:34 AM James URL:.....(multi rows)
1 6/10/2017 8:45:34 AM Jenny URL:....
編集に提供される使用することです:ここでは別のアプローチがある
- 抽出時間STRを使用してpd.to_datetime
- 抽出URLを使用して.contains(URL)
- 他のすべての名前へ移動
- GroupNは3行ごとにNaNを埋め、重複を削除します。
DF [ '時間'] = pd.to_datetime([ 'COL'] DF、誤差= '強制')[ 'COL' DF
df.loc []。str.contains( 'URL' )、 'URL'] = df ['col']
df ['Name'] = df [(df ['Time'])isnull()& df ['URL']。isnull())] .COL
.ffill df.drop( 'COL'、軸= 1).groupby(df.index // 3)()。bfill()。drop_duplicates()
あなたはを取得
Time URL Name
0 2017-06-10 08:40:34 URL:.....(multi rows) James
3 2017-06-10 08:45:34 URL:.... Jenny
「URL」の値が複数あるか、「Time」、「Name」、および「URL」の複数のトリプレットがあるとしますか? – BenWurth
データセットの行は、日時、名前、URL(1つ以上)などの順序に一致するグループに分けることができますか? –
urlの複数の行は、その場所に基づいてデータを抽出できないことを意味します。だから私はタイムスタンプを最初に取得し、名前やURLのような他の変数を取得するためにタイムスタンプの場所を使用すると考えています。 –