CoinMarketCap価格表を取得しようとしています。私はした:テーブルの文字列置換
url_cmp <- "https://coinmarketcap.com/currencies/views/all/"
library(rvest)
url_cmp %>%
read_html() %>%
html_nodes(css = "table") %>%
html_table() -> "tbl_cmp"
今私はテーブル全体をきれいにしたいと思います。テーブルからすべて$
,%
、,
、の文字を削除します。私が試した:
stringr::str_replace_all(string = tbl_cmp, pattern = "\\\n|\\s|[%*$,]", replacement = "")
と
gsub(pattern = "\\\n|\\s|[%*$,]", replacement = "", x = df_cmp)
を意図し、交換しませんが、表形式がもはや保持されている両方。私は長い文字列を取得します。私はstr_replace()
とgsub()
の両方が入力として文字列を取ることを理解しています。テーブルの回避策はありますか?
構造全体を保持するために、列全体にgsub関数を適用することをお勧めします。https://stackoverflow.com/questions/29271549/replace-all-occurrences-of-aデータフレーム-string-in-a-data-frame –
「as.data.frame(sapply(tbl_cmp [[1])、function(i)gsub( '[[:punct:]] | \\\ n' 、 ''、i))) ' – Sotos