と間違っているクラスがあり、コードが続くpickle.PicklingError:__newobj__引数から引数[0]私は私が火花を経由してストップワードを削除するトリング午前しようとしていますHadoopのパイソン
from nltk.corpus import stopwords
from pyspark.context import SparkContext
from pyspark.sql.session import SparkSession
sc = SparkContext('local')
spark = SparkSession(sc)
word_list=["ourselves","out","over", "own", "same" ,"shan't" ,"she", "she'd", "what", "the", "fuck", "is", "this","world","too","who","who's","whom","yours","yourself","yourselves"]
wordlist=spark.createDataFrame([word_list]).rdd
def stopwords_delete(word_list):
filtered_words=[]
print word_list
for word in word_list:
print word
if word not in stopwords.words('english'):
filtered_words.append(word)
filtered_words=wordlist.map(stopwords_delete)
print(filtered_words)
ようで、私が得ました次のエラーが表示されます。
pickle.PicklingError: args[0] from newobj args has the wrong class
私はなぜ、誰かが私を助けることができません。あなたが唯一の行とcolumn.so、各単語を有するRDD上にマップを使用している
こんにちは、私は同じ問題に直面しています、stopwords_deleteののfuctionを置き換えるために、リストの内包表記を使用することができます。解決を待っています。 –