2017-10-05 8 views
0

私は正規表現を扱うことに困難があります。パンダの大括弧を削除するには?

これは私が取り組んでいるデータフレームです。 kaggleからのデータです (url = 'https://www.kaggle.com/c/pkdd-15-predict-taxi-service-trajectory-i') 私がしたいのは、各行ごとに[経度、緯度]ごとに区切り、それぞれの単位を使用することです。

例えば、行ごと 長い& LAT = [long0、LAT0]、[、]、[、]、[、] ,,,,,, [長いN、緯度N] 又は長い& LAT =
と私は 長い&緯度のように、各ユニットを抽出したい[0] = [long0、LAT0] または 長い&緯度[0] = long0、LAT0可能 は、どのように私はそれに対処することができますか?

私はこれらのようないくつかの方法を試しました。

df_concat['POLYLINE'][0].str.split(',')[0] 
df_concat['POLYLINE'][:3].apply(pd.Series) 

しかし、それを行う方法が見つかりませんでした。

答えて

0

あなたが

long&lat long lat 
0 [100, 50] 100  50 
1 [200, 150] 200  150 
を取得

df['long'] = df['long&lat'].apply(lambda x: x[0]) 
df['lat'] = df['long&lat'].apply(lambda x: x[1]) 

それとも単に

df[['long', 'lat']]=df['long&lat'].apply(pd.Series) 

を使って緯度と長い値を得ることができます

long&lat 
0 [100, 50] 
1 [200, 150] 

dfをこのダミーを考えてみましょう210