2016-08-12 18 views
0

私は、各ドメインが発生する頻度を見つけたExcelスプレッドシートのデータフレームを持っています。私はそれに対応するドメインのドメイン頻度カウントを追加したい。データフレーム列に行を追加する

 index domain  extractor  Frequency 
     0  linkedin.com skipped   2 
     1  facebook.com skipped   5 
     2  hi5.com  skipped   1 
     .... 

ここでは、頻度を見つけて対応するドメインに追加しようとするコードです。

Nehalが掲載され
Index url             Frequency 
0  https://www.linkedin.com/in/dgerstenblatt     0 
1  http://www.linkedin.com/in/darren-cfbs-5465872   1 
2  http://www.hi5.com/friend/p39168004--profile--...   2 
3  http://license.reg.state.ma.us/pubLic/pubLicen...   3 
4  http://license.reg.state.ma.us/pubLic/pubLicen...   4 
5  http://profiles.friendster.com/3523606     5 
6  http://www.lenoxadvisors.com/biographies/darre...  NaN 
7  http://10digits.us/n/Darren_Gerstenblatt/Newto...  NaN 
8  http://www.facebook.com/people/_/692786728    NaN 
+4

http://stackoverflow.com/q/22391433/1005215 –

答えて

0

、これは正解です:

cnt = Counter() 

for row_index, row in df.iterrows(): 

    cnt[row['domain']] += 1 

    for i in cnt: 
     frequency = cnt 

     if i in row['domain']: 
      df['Frequency'] = df.loc[:(cnt[i])] 

は、私がデータフレームから周波数を印刷するとき。 stackoverflow.com/q/22391433/1005215

+0

質問を削除してください – Merlin

関連する問題