site
1 Google.com
2 yahoo.in
3 facebook.com
4 badge.net
だから、私は後にすべての単語を削除するいくつかのドメイン名を含むテーブルを持っています「」たとえば、(.com、.net、.in)です。 以下の関数を使用しましたが、文字列を数値形式に変換します。
gsub("\\..*","",df)
site
1 Google.com
2 yahoo.in
3 facebook.com
4 badge.net
だから、私は後にすべての単語を削除するいくつかのドメイン名を含むテーブルを持っています「」たとえば、(.com、.net、.in)です。 以下の関数を使用しましたが、文字列を数値形式に変換します。
gsub("\\..*","",df)
あなたは、ドメイン名で作業しているので、あなたはそうするように設計されたいくつかのツールを使用することもできます。@Sotosため
library(urltools)
df <- data.frame(site=c("Google.com", "yahoo.in", "facebook.com", "badge.net"))
suffix_extract(df$site)
## host subdomain domain suffix
## 1 Google.com <NA> google com
## 2 yahoo.in <NA> yahoo in
## 3 facebook.com <NA> facebook com
## 4 badge.net <NA> badge net
:
urltools::suffix_extract('www.bankofcyprus.com')
## host subdomain domain suffix
## 1 www.bankofcyprus.com www bankofcyprus com
@sotosを見つけるのは簡単です、いいえ?私はそれのための出力を追加しました。 – hrbrmstr
ええ、ありがとう私はドメインが必要ですが、今私はこのソリューションからそれを抽出することができます。 –
OKY。その作品はありがとう.. –
http://stackoverflow.com/questions/14173754/splitting-a-file-nameは良いクローズソースではありません。なぜなら、*最初のカンマが見つかって、それがすべて削除されたからです。ファイルパスの分割では、アルゴリズムが異なります。 –
これは多分関連しているかもしれませんhttp://stackoverflow.com/questions/19020749/function-to-extract-domain-name-from-url-in-r –