0
私のアプリケーションでは、スタンフォードNLPでnlpジョブを実行します。スタンフォード解析モデルはjarファイルにパッケージ化されており、UDFとして機能します。私はsqlContext.sqlを使用してそれを使用します。しかし、私はそれがゆっくりと動くと感じます。誰でも私はそれをスピードアップするのを助けることができますか?スパーク:stanford-nlpの実行が遅すぎる
コードを次のように
sqlContext.sql("CREATE TEMPORARY FUNCTION segmenter AS 'cn.com.datamesh.stanford.nlp.StanfordNlp'").collect()
sqlContext.sql("SELECT segmenter(text) FROM twitter_data")
何らかの方法でスピードを上げることに成功しましたか? – Shaido