2016-08-10 26 views
-2

だから、このようなものになります。テキストファイルからの文字列の部分の抽出

このファイルには、配列に入れたURLのリストがあります。

これらのURLのそれぞれからドメイン名を抽出するコードを書く必要があります。

ただし、これらのURLの形式は不明です。 「http://」、「https://」、「www。 "google.com/..."と始まります。後ろの部分は、 ".com"や ".gov"の直後に切り捨てる必要があります。

私の人生のためにこれをコード化する方法を見つけ出す。

+0

スプリット(存在する場合)と最後のドット(のような正規表現をしようとするあなたを提案しますそれが存在します)。 – Blobonat

+0

正規表現ですか? – molbdnilo

+1

通常、このようなものを徐々に開発する必要があります。始めから '//'(見つかった場合)までのすべてのもののように、知っている必要があると思っている部分を取り除くことから始めます。その後、最初の '/'(最後に見つかった場合)から最後まで、すべてを削除します。必要でない部分をすべて削除するまで続きます。 –

答えて

-1

文字列を分割してドメインのルート名を取得することができます。

場合、私は最初のドットの前でこの

(/^http?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);

(/^https?\:\/\/([^\/?#]+)(?:[\/?#]|$)/i);

(/^https?\:\/\/(?:www\.)?([^\/?#]+)(?:[\/?#]|$)/i);

関連する問題