2016-09-19 10 views
0

私は、Jupyterノートブックのpythonを利用して、いくつかのデータをWebから引き出しています。私はデータをプルダウンし、解析し、データフレームを作成しました。私はデータフレームにある文字列の中から数字を抽出する必要があります。私はそれを行うには、この正規表現を利用:re.search pythonのマッチ値を取得する

for note in df["person_notes"]: 
    print(re.search(r'\d+', note)) 

と結果は以下の通りです:

<_sre.SRE_Match object; span=(53, 55), match='89'> 

どのように私はちょうど試合数を取得することができます。この行は89行になります。行全体をstr()replace()に変換しようとしましたが、すべての行にspan=(number, number) iqualがあるわけではありません。前もって感謝します!

答えて

1

あなたは、文字列内の正しい位置を取得するために返されたマッチオブジェクトのstart()end()メソッドを使用することができます。

for note in df["person_notes"]: 
    match = re.search(r'\d+', note) 
    if match: 
     print(note[match.start():match.end()]) 
    else: 
     # no match found ... 
関連する問題