私は例えばのURL でドメインを削除したいですユーザーは、www.google.com 入っしかし pythonのURLから.comを削除するには?
がどのようにPythonでこれを行うには、私は唯一のwww.google必要ですか? おかげ答えて
あなたはすべての可能なドメインdomains
のリストを持っている場合は、それ
url = 'www.google.com'
cut_url = str[:-4]
# output : 'www.google'
より高度な答え
をスライスし、最後に4つの文字を削除したい場合は:
domains = ['com', 'uk', 'fr', 'net', 'co', 'nz'] # and so on...
while True:
domain = url.split('.')[-1]
if domain in domains:
url = '.'.join(url.split('.')[:-1])
else:
break
または、例えば、あなたが.co
と.uk
が分離されていないドメインのリストを持っている、とします
domains = ['.com', '.co.uk', '.fr', '.net', '.co.nz'] # and so on...
for domain in domains:
if url.endswith(domain):
cut_url = url[:-len(domain)]
break
else: # there is no indentation mistake here.
# else after for will be executed if for did not break
print('no known domain found')
'www.mysite.io'または' www.mysite.om'はどうですか? ..等 –
多分 '' .'join(mystr.split( '。')[: - 1]) 'です。しかし、 '.co.uk'はどうですか? 「.com」と「google.com」と「www.google.com」はすべて異なる種類のドメインであるのに対し、質問者は「ドメインを削除する」と述べているため、この問題は不十分です。実際の問題に応じて、完全な解決策がMozilla Public Suffix Listを使用する必要があります。 –
これらのケースを含めるように編集しようとしていましたが、最初にOPの質問に対して簡単な回答を提供したいと思ったのですが、 – BusyAnt
これは非常に一般的な質問です。次のようにしかし、最も狭い答えは(と仮定しurl
が問題のURLを保持している)のようになります。
if url.endswith(".com"):
url = url[:-4]
あなたはそれの右への最後の期間、すべてを削除したい場合は、コードがもう少し複雑になります:
pos = url.rfind('.') # find rightmost dot
if pos >= 0: # found one
url = url[:pos]
'url.rsplit( '。'、1)[0]'は一番右のドットで分割して最初の項目を返す –
@MosesKoledoye:または 'url.rpartition( '。')[0] '。 –
@SteveJessopが指摘しているように、eTLD(実効トップレベルドメイン)は複数のコンポーネントで構成されている可能性があります。たとえば、 '.co.uk'は元々アメリカの、現在はグローバルな' .com'ドメインの英国に相当します。 – holdenweb
ここに必要なものはrstrip
です。
url = 'www.google.com'
url2 = 'www.google'
new_url = url.rstrip('.com')
print (new_url)
new_url2 = url2.rstrip('.com')
print (new_url2)
rstrip
はこの場合のみ ".COM" で、取り除くことができます。そうでない場合は、そのまま放置します。 rstrip
は、 '最も右の'一致文字列を取り除くためのもので、lstrip
はこれとは逆です。これらを確認してくださいdocs。 stripとlstripの機能もチェックしてください。それはここで別の答えに近い関連けれども私は、別の解決策を提出してい
UPDATE
@SteveJessopは、上記の例ことを指摘したように適切なソリューションではありません、それは文字列がで終わっている場合は最初にチェックしません「.com」。
url = 'www.foo.com'
if url.endswith('.com'):
url = url[:-4]
print (url)
- 1. Python/DjangoのURLから%07を削除するには
- 2. URLをもとにURLからindex.htmlを削除するには
- 3. ウェブサイトのURLから#を削除する
- 4. JQuery.address - URLから#を削除
- 5. PythonのURLからutm_ *パラメータを削除します
- 6. XMLサイトマップからURLを削除する
- 7. Rails:コントローラをURLから削除する
- 8. Yii2:コントローラーをURLから削除する
- 9. URLからパラメータを削除する.htaccess
- 10. realurl urlから£を削除する
- 11. URLをワードプレスから削除する
- 12. テキストファイルからURLを削除する
- 13. Wordpress URLからスラッグを削除する
- 14. URLからファイルを削除する
- 15. CakePHPはリダイレクト後にURLから "?url ="を削除します
- 16. COM +アプリケーションからCOM +コンポーネントをプログラムで削除するにはどうすればいいですか?
- 17. 文字列からhttps://および.comを削除する
- 18. は、ウェブサイトのURLから自宅削除
- 19. MagentoのURLからindex.phpを削除するには
- 20. joomlaのurlからcatidとitemidを削除するには?
- 21. laravel 5.2のURLからpublicを削除するには?
- 22. WordPressのサイトURLからindex.phpを削除するには
- 23. CodeigniterのURLから "&per_page ="を削除するには
- 24. カテゴリをページのURLから削除するには?
- 25. ページのURLからページを削除するには
- 26. メインページのURLからGETパラメータを削除するには?
- 27. cakephpのURLからアクション名を削除するには?
- 28. eclipseのURLからプロジェクト名を削除するには?
- 29. codeigniter projectのurlからindex.phpを削除するには
- 30. VBのURLから属性を削除するにはscdript
ユーザーが「www.google.com.au」または「www.google.co.uk」と入力した場合はどうなりますか? – mhawke
@Aryan、あまりにも海外にあるように、より詳細な質問を編集して、要件に絞り込んでください! –
私はそれはあなたがURLを操作するために設定したときに、実際の要件は、すべての可能なケースであるかを考え出すことは、通常ははるかに困難にコードを書くよりもあると付け加えた価値があると思います。 –