2016-06-13 4 views
0

こんにちは、このテキストブロック(元のmboxファイル)からヘッダ名(太字で表示)を抽出する方法をお探しです 私は崇高なテキスト正規表現検索???(\ + W) - - +パイソン ^ \ W上のdidntの仕事(\ + w)は?:regex - python電子メールヘッダ名を抽出する

rgex = re.findall('^\w+-?(\w+)?-?(\w+)?:', mail); 

これは

X-どうやら-に INSIDEメールは何かということです: [email protected];木、2016年6月9日夜01時41分21秒0000
リターンパス
-SPF受信:から:パス
を受信(yahoo.comのドメインが許可され、送信者として72.30.235.45を指定) SMTPSを使用するmta1287.mail.ne1.yahoo.comの127.0.0.1(EHLO n3-vm9.bullet.mail.bf1.yahoo.com)(72.30.235.45)。 Thu、09 Jun
2016 13:41:21 +0000
DKIM-署名:v = 1; a = rsa-sha256; c =緩和/緩和; d = yahoo-inc.com; s = yibm; t = 1465479679;へ
[email protected]
から: "ヤフー"
返信先: "ヤフー"
X-YMailISG:PCypxycWLDvGv4Bg8ShrtzVYi3vpFMAjYaqWyWybcVJ_ZQff eyquyqb..Qu6UKhX_Tyz5b3da2iDtRStJpVnNulZHOb8GznJQTCKk9sjvboS KsbzY4E1uScWz0Ieo0jjG0YHrB1dTCzOSeMiPNumCCFS1sR3_SkyMBGG_D2D wWtdRducxLa2YgEMMubVpMtNJMBv.bwk0 .E.jQNEy8I3LnJEqcDpmIUM7bZL XgkEFz7yl1Zo6Sj4r0z6pGlVIFOql7uG9Bwq2VJoK1Q1upKJUOBfQqzf64y2 9fXLnQsWENpZloxwncGzLhdzEYGgE3xNuFV8QFxZGXyvtKZF oykH49M03URN jtx8Yg6ypjyRbBIRVJGVFbjAvW6io3yeyIFh042jlgYQtLxbneFA60hn9ifT Mit3bQ5l7Tginw0OgRM2cbqLo0tEZFt9vlN597Z3vPGwsVdBcTp9wnk6orj2 TqjEpAmODy3Yru2HzDP7Dbwq9CGaIozUm91VNWqw5Dy7AMQEsuvnBop7Fflk G21m1WKMBgrS.2bOLQ4797E09LjlyyoWI9FouUNNhDljnPPf2AeKUKzauctw ULOQPveWAm4lDsNLMp5yvXDYNIe5HMor84SVd8_xF3Icna1PAftXGzJUHrXK NZSEN_VO0GprGfaNQg4uSW_0wXFXwC6TYQ4CMjz53o0qNGpILogVfRLwFCFL DtW8nimkLLsNzmDajzJsR_juA86Orw2NE5ED4qdpPxmyxyrXYOQPu3O6zeYf 7mBzU0aX7VHJUxJ4L3HdB9qTjbTaCdnySrnjGtd7u9Cn9yRJirDNeg3UA82P PeA1ZDfc0vKdrn5QI6e6YKa2TTt7Dspy3jObgSapH5epc3LyQVyN7yjpxrq_ MXAbpqedjUfcwq3c7lpt8xxUxy.MXWg0fJO059xijvb_sYTaQTGUWAMeVU.6 IW.hSksejwpn._CgE9Kqabbk5 qgYIdYRW1pmz5OBYh0skCX1TrFRuxbGvDit R_wr.wbTpJGiSST.b0ZetmgN72bVvlRtmNPw1Dk.zxaacXxhGSMWupPUDLJZ OMrap2ax8oiQrxT3jIhk8seIkaNJ.tGUhlPx6G4lJJaz0g89LmjBaEjGUG8P W3Phh9db3hjxUIX5UC0jg5ai2XZ7u_wXn2Muk61N1eRCZ0oA2S25YDPK1dh。 3VQ6pH8SSBxVkQHUJXbZUNqLAzi5V5wRS7oeitXERGgA2DiZB268.rJxS7di OMT5eGoITG4LnAo1M3nsVQ6xceHDd4v6KD9KfBgTHX_iLUv_skCv4dVUgVvj edKOFiOMHBTpJ9J9BECjTTzEUpc.fCNUcRwSsiSkqbRhUsAdCbxQZir3Nb1Z 6FzI6J2eNqpj4azjmDeI15R8MyN7VFc6bl6pCZySk2Tx5SQESDm.sVkADSVR pI2nuscEjU3xo_qGUxbh5mbAA17K2zYpcFXaOce8_9Eszos5pURCcdtBYUqI I_DOtvNe.zWY1ShRcr9ZzTj3ibmc7NBmvumhVMjqirb12mfJ6oxHv8d86gze HtAJmJghczUg5otSzdxSgEJJxjMZrzSidJ9FP.gPiPWtuukz82YpZ32MnCVs 6.V2DRxpUmZa31KH93QSEzwMlCn3FFTLBv9izcjoFP81yeAn.3QloF8XIC3K WmtXtloyeGjuygAhlkd_prXmMGGC5JmPlY8xu4k1NavkdDh6pG6zIkt83Wsd P.D.0BgM
X-発信IP:[75.30.245.45]
認証-結果:mta1287.mail.ne1.yahoo.com = yahoo-inc.comから。 domainkeys =ニュートラル(sigなし); from = yahoo-inc.com; DKIM =パス(OK)

+1

うーん...のようなものを試してみてください[ '([^ \ sの?!] * \ D +:\ D +)([^ \ sの:] + ): '](https://regex101.com/r/wY3qH2/1)。 –

+2

'email'パッケージを使ってヘッダを解析してヘッダ名を取得しないようにする理由はありますか? – donkopotamus

+0

donkopotamus-はい私の場合は特定のファイルからでなければならない – user1731805

答えて

関連する問題