2017-10-17 1 views
0

tweetsDFとHashtagsDFの2つのデータフレームがあります。両方のデータフレームのtweet_status_idが等しく、1つのツイートのハッシュタグ数を取得したい。これは私が使用している照会で、イントゥールがスローするものですPysparkデータフレームを解決する方法クエリエラーキーワードは式にすることはできません

ERROR : SyntaxError: keyword can't be an expression 

tweet_hashtags_count_DF = tweetsDF.join(HashtagsDF,sum('tweetsDF.*'),tweetsDF.tweet_status_id == HashtagsDF.tweet_status_id & tweetsDF.tweet_status_id='636984052600274944').show() 

ここで私は間違っていますか?

答えて

0

tweetsDF.tweet_status_id == '636984052600274944'=の代わりに==)を試してください。

+0

ありがとうございました。 @andrew – Jayasree

+0

素晴らしい!その場合は、回答の横にあるチェックマークをクリックして、この回答を受け入れてください。そしてStackOverflowへようこそ! –

+0

TypeError:+: 'int'および 'str'のサポートされていないオペランドタイプ サポートされていないオペランドタイプのエラーです。しかし、今どこのクエリで私は '+'を使用しています。これで私を助けてくれますか? @andrew – Jayasree