2017-11-20 11 views
0

私は教授の名前のセットからタイトルを削除しようとしています。 のようにDr.Eng, Dr.rer.nat, M.S., Dr., S.Siなど。基本的に、複数のドットを含む文字列。句読点を含む文字列を選択してください

私はに基づいて名前とタイトルを分割した後、これは「」例のリストである

2  [CHOTIMAH, Dr., M.S., RINTO ANUGRAHA NQZ, S... 
3  [HARSOJO, S.U., M.Sc., Dr., SUDARMAJI, S.S... 
4  [IKHSAN SETIAWAN, S.Si., M.Si., ARI SETIAWAN... 
5  [EKO SULISTYA, Dr., M.Si., YOSEF ROBERTUS UT... 
6  [SUNARTA, Drs., M.S., WAGINI R., Drs., M.S.] 
7  [BAMBANG MURDAKA EKA JATI, Drs., M.S., KAMSU... 
8  [AHMAD KUSUMA ATMAJA, S.Si., M.Sc., Dr.Eng.... 
9     [MOH. ALI JOKO WASONO, M.S., Dr.] 

私はr'\S*[^\w\s]\S'を試してみましたが、それはいくつかの教授の名前が短縮され

CHOTIMAH, INTO ANUGRAHA NQZ, . 
HARSOJO, UDARMAJI, i. 
IKHSAN SETIAWAN, RI SETIAWAN, ng. 
EKO SULISTYA, OSEF ROBERTUS UTOMO, Dr. 
SUNARTA, AGINI . 
BAMBANG MURDAKA EKA JATI, AMSUL ABRAHA, Prof. 
AHMAD KUSUMA ATMAJA, ITRAYANA, Dr. 
MOH. ALI JOKO WASONO, Dr. 

を返さXXXに例:MOHAMMAD TO MOH.そして私はそれを削除したくありません。

ご協力いただきましてありがとうございます。

+0

もしあれば、試してみてください(pd.Serise) – Wen

答えて

0

\w{0,}\.(\w{0,}\.)?この正規表現のテスト文字列は、任意の長さの単語とそれに続くピリオドを取得し、任意の長さの別の単語の後に任意にピリオドを探します。これはDr.M.S.などをキャプチャします。私があなたに求めているのは、私には分かりません。

将来、regexr.comを使用して正規表現の一致を簡単にテストできます。また、あなたはPythonPandasとこの投稿をタグ付けしましたが、それらは本当に関連性の高いタグではありません。タグを関連性のあるものにするためのコードを追加するか、無関係のタグを使用しないようにしてください。

+1

Whoa、ありがとう!私は私のpythonコード(特に、私のパンダのデータフレーム)で使用したいので、私はここでかなり新しいです、私は、Pythonのタグを付けました。それにもかかわらず、提案に感謝します。 – Tata

+0

Btwでは、 "Dr.Biotech"、 "Dr"、 "MBA"、 "S.Si"などのタイトルは削除されませんでした。あなたは単純な正規表現を使用してこれを解決すると思いますか? – Tata

+0

あなたの最善の策は、それらが非常に具体的であるため、これらの文字列を明示的にマッチさせることです。 –

関連する問題