2016-07-12 8 views
3

私はR tmのパッケージを使用していますし、私は彼らのインデックスとそのメタデータによって特定の文書を選択しようとしています:メタデータに基づいてRのtmコーパスの文書をフィルタリングする方法は?

orbit_corpus<-Corpus(tm_corpus, readerControl = list(reader=myReader)) 

meta(my_corpus[[1]]) 

author : a8 
origin : Department 
heading : WhiB 
id  : 1 
year : 2013 

私は私のコーパスの最初の百の文書内持っているすべての文書を見つける取得したいと思いこれは、文書1のメタデータ「今年は」私は基準を満たしてくれ最初の100の間ですべてのインデックスを検索するためのオプションを与えるものを、必要とする2013年

meta(my_corpus[[1]],"year") == 2013 
[1] TRUE 

であるかどうかを識別するために働く2013年 に掲載されて。 私はこれに似た何かを想像するでしょう(しかし、うまくいかず、残念ながらドキュメントのリストも生成されません)。

meta(orbit_corpus[[1:100]],"year") == 2013 
Error in x$content[[i]] : recursive indexing failed at level 4 

多くのご協力ありがとうございます!

答えて

4

あなたは

tm_filter文書からコーパスの最初の100の文書に関するtm_filterorbit_corpus[1:100]

tm_filter(orbit_corpus[1:100], FUN = function(x) meta(x)[["year"]] == "2013") 

を使用することができますがFUN試合ドキュメントを含むコーパスを返し

+0

ありがとうございます!これはうまく動作します! – Sawol

関連する問題