2017-07-05 2 views
1

このコードを使って、htmlの最後の "/"の後にこの部分を抽出します。私はその区画をリンク自体の直後にカンマで区切っています。ただし、出力ファイルでは、パーティションは常に新しい行にプッシュダウンされ、関連するリンク行に継続的には接続されません。Python:文字列の一部を何らかの形で新しい行にプッシュダウン

linkがラインであるため、あなたが str.rstripを使用して取り除く必要がある末尾の改行文字があるためです
with open('links_parts.txt', mode='wt') as outfile: 
    for link in file_to_set('links.txt'): 
    path_parts = link.rpartition('/')[2] 
    outfile.write(link + ','+ path_parts + '\n') 
+0

を...多分それはあなたの手掛かりを与えるでしょう何が起こっているのか、どのように進むのか... – EvgenyKolyakov

+0

'file_to_set'を返すものは? – PRMoureu

+1

あなたのテキスト文字列に 'strip()'を実行してみてください。 [チュートリアル](https://www.tutorialspoint.com/python/string_strip.htm) – patrick

答えて

3

:あなたの変数を印刷してみ

for link in file_to_set('links.txt'): 
    link = link.rstrip() 
    path_parts = link.rpartition('/')[2] 
    outfile.write(link + ',' + path_parts + '\n') 
関連する問題