2017-12-28 23 views
-1

私は約190,000行のFacebookデータのcsvファイルを持っています。私はほとんどのコメント(comment_messageの#)とSentiment > 0を持っている人いるcomment_author知りたいcsvファイルのRでデータをフィルタリングする

comment_id, status_id, parent_id, comment_message, comment_author, comment_published, comment_likes, Positive, Negative, Sentiment

:列名は次のとおりです。

Rを使用してこのフィルタを適用する方法を知っている人はいますか?

+1

ようこそ。 [最小限で完全で証明可能な例を作成する方法](https://stackoverflow.com/help/mcve)を読んで投稿を更新してください。 –

答えて

0

dfがデータフレームである場合は、以下のようdplyrパッケージを使用することができます。

df %>% group_by(comment_author,sentiment) %>% 
     dplyr::summarize(total_number_comment=sum(comment_message)) %>% 
     as.data.frame() %>% 
     arrange(desc(total_number_comment)) %>% 
     filter(sentiment>0) 

を私は(あなたがインスタンスの例を提供する必要があります)あなたが本当にsentiment変数に何をしたいのか理解していませんでしたグループ分けされています

+0

あなたの迅速なサポートには本当にありがとうございます!センチメントは-5から5の数字を示し、0は中立です。たとえば、-5はコメントが非常に否定的であることを意味します。 私はあなたの提案したコードを使用しようとしましたが、私はいつもエラーメッセージを表示しようとしました:df%のエラー>%group_by(comment_author、Sentiment)%>%dplyr :: summarize(total_number_comment = sum(comment_message))%>%:could関数を見つけられません "%>%" あなたは私が間違っていたことを知っていますか?コードに何かを追加する必要がありますか? 事前に感謝します:-) – lzed

+0

@lzed dplyrライブラリがインストールされていますか?あなたのコードライブラリ( "dplyr")の前で使ってください –

関連する問題