を重複したインデックスエントリのリストを作成します。私は、タイムスタンプ文字列のリストを作成したい。可能であれば、重複しているタイムスタンプごとに1つのタイムスタンプを返したいと思います。私はインデックス内のスタンプが重複していた時間を識別しようとしているパンダのデータフレームに
#required packages
import os
import pandas as pd
import numpy as np
import datetime
# create sample time series
header = ['A','B','C','D','E']
period = 5
cols = len(header)
dates = pd.date_range('1/1/2000', periods=period, freq='10min')
dates2 = pd.date_range('1/1/2022', periods=period, freq='10min')
df = pd.DataFrame(np.random.randn(period,cols),index=dates,columns=header)
df0 = pd.DataFrame(np.random.randn(period,cols),index=dates2,columns=header)
df1 = pd.concat([df]*3) #creates duplicate entries by copying the dataframe
df1 = pd.concat([df1, df0])
df2 = df1.sample(frac=1) #shuffles the dataframe
df3 = df1.sort_index() #sorts the dataframe by index
print(df2)
#print(df3)
# Identifying duplicated entries
df4 = df2.duplicated()
print(df4)
リストを使用して、タイムスタンプごとにすべての重複エントリを呼び出したいとします。上記のコードから、bool型に関連するインデックスをfalseに呼び出す方法はありますか?
編集:いくつかのユニークな価値を創造するために余分なデータフレームを追加し、単一repeat.Alsoが質問に詳細を追加した以上のものを作成するために、最初のデータフレームを三倍。
これは本当によく働き、他の答えのいずれよりももう少し柔軟性があります。タイムスタンプのリストを文字列に変換する簡単な方法はありますか?私はto_stringを使用しようとしましたが、リストにはその属性がありません。基本的にタイムスタンプのリストを次のように作成します: ['2000-01-01 00:00:00' '2000-01-01 00:40:00' '2000-01-01 00:20:00 「 '2000-01-01午前0時30分00秒' '2000-01-01午前0時10分00秒'] –