私はこのレッスンの問題に取り組んできましたが、最後にクイズが探していた答えを得ました。私は5週間も経たないうちに、Rにはかなり新しいですが、これは理解するのに何時間もかかりました。私は、ユルギス、オナ、シカゴのすべての出現をザジャングルから見つけることを任されました。R:すべての名前の検索
問題:「Jurgisread」に凝縮なり、カウントをピックアップしていないでしょう「ユルギスは読み」:私はいくつかの要素が二つの言葉だったことを後でGSUBを使用して句読点を削除し、多くの時間を無駄にしたが実現します。その後、オナとシカゴシカゴのための "Jurgis"の "Jurgiss"への凝縮などがありました。
:これらのタイプのファイルを今後どのように処理するかについてのヒント。
私が行ったこと:私は始めに最初の2行のコードを与えられました。私は彼らが来たスペースを使って要素を分割しました。次に、削除したい句読点を選択しました。いったん私が取り除いた、私が思ったのは、すべて共通のものであり、それらをスペースで置き換え、再び要素を分割します。最後に、私はtable()を呼び出し、すべての単語を大文字にするようにしました。
theJungle <- readLines("http://www.gutenberg.org/files/140/140.txt")
theJungleList <- unlist(strsplit(theJungle[47:13872], " "))
splitJungle1<-unlist(strsplit(theJungleList, "[[:space:]]", fixed = FALSE,
perl = FALSE, useBytes = FALSE))
remPunctuation<-gsub("-|'|,|:|;|\\.|\\*|\\(|\"|!|\\?"," ",splitJungle1)
splitJungle2<-unlist(strsplit(remPunctuation, "[[:space:]]", fixed = FALSE, perl
= FALSE, useBytes = FALSE))
table(toupper(splitJungle2)=="JURGIS")
table(toupper(splitJungle2)=="ONA")
table(toupper(splitJungle2)=="CHICAGO")
ありがとう!
ご参照ください:[なぜ「誰かが私を助けることはできますか?」されていない実際の質問?](http://meta.stackoverflow.com/q/284236) – EJoshuaS