2017-08-03 22 views
1

から行をフィルタリングする正規表現パターンを使用して:私はこのようなパンダのデータフレームがあるとパンダのデータフレーム

  Word  Ratings 
    0  TLYSFFPK 1 
    1  SVLENFVGR 2 
    2  SVFNHAIRK 3 
    3  KAGEVFIHK 4 

がどのように私は次のように一致する単語を持つ行をフィルタリングするパンダに正規表現を使用することができます正規表現のパターンを維持しますが、データフレームの書式は保持しますか?正規表現パターンである:\のB [VIFY] [MLFYIA] \ W + [LIYVF] [KR] \ B

期待出力:

  Word Ratings 
    1  SVLENFVGR 2 
    2  SVFNHAIRK 3 

答えて

0

デモ:

In [2]: df 
Out[2]: 
     Word Ratings 
0 TLYSFFPK  1 
1 SVLENFVGR  2 
2 SVFNHAIRH  3 
3 KAGEVFIHK  4 

In [3]: pat = r'\b.[VIFY][MLFYIA]\w+[LIYVF].[KR]\b' 

In [4]: df.Word.str.contains(pat) 
Out[4]: 
0 False 
1  True 
2 False 
3 False 
Name: Word, dtype: bool 

In [5]: df[df.Word.str.contains(pat)] 
Out[5]: 
     Word Ratings 
1 SVLENFVGR  2 
関連する問題