2016-09-01 10 views
4

せずに私はエキスドメイン名サフィックスまたはサブドメイン

site 
1 Google.com 
2 yahoo.in 
3 facebook.com 
4 badge.net 

だから、私は後にすべての単語を削除するいくつかのドメイン名を含むテーブルを持っています「」たとえば、(.com、.net、.in)です。 以下の関数を使用しましたが、文字列を数値形式に変換します。

gsub("\\..*","",df) 
+0

OKY。その作品はありがとう.. –

+1

http://stackoverflow.com/questions/14173754/splitting-a-file-nameは良いクローズソースではありません。なぜなら、*最初のカンマが見つかって、それがすべて削除されたからです。ファイルパスの分割では、アルゴリズムが異なります。 –

+1

これは多分関連しているかもしれませんhttp://stackoverflow.com/questions/19020749/function-to-extract-domain-name-from-url-in-r –

答えて

5

あなたは、ドメイン名で作業しているので、あなたはそうするように設計されたいくつかのツールを使用することもできます。@Sotosため

library(urltools) 

df <- data.frame(site=c("Google.com", "yahoo.in", "facebook.com", "badge.net")) 

suffix_extract(df$site) 
##   host subdomain domain suffix 
## 1 Google.com  <NA> google com 
## 2  yahoo.in  <NA> yahoo  in 
## 3 facebook.com  <NA> facebook com 
## 4 badge.net  <NA> badge net 

urltools::suffix_extract('www.bankofcyprus.com') 
##     host subdomain  domain suffix 
## 1 www.bankofcyprus.com  www bankofcyprus com 
+2

@sotosを見つけるのは簡単です、いいえ?私はそれのための出力を追加しました。 – hrbrmstr

+0

ええ、ありがとう私はドメインが必要ですが、今私はこのソリューションからそれを抽出することができます。 –

関連する問題