私はSCALAに2つのRDDを持ち、それらをデータフレームに変換しました。 は今、私はprodid
とuid
という名前の2つの列を持つ2つのdataframes.One prodUniqueDF
を持って、それが製品スカラの2つのデータフレームの一致
scala> prodUniqueDF.printSchema
root
|-- prodid: string (nullable = true)
|-- uid: long (nullable = false)
のマスターデータをしている私はprodid
という名前の列を持っている第二に、ratingsDF
、custid
、ratings
scala> ratingsDF.printSchema
root
|-- prodid: string (nullable = true)
|-- custid: string (nullable = true)
|-- ratings: integer (nullable = false)
私は上記の2つに加わり、ratingsDF.prodid
をprodUniqueDF.uid
に置き換えたいと思います。ratingsDF
これを行うために、私は、最初の 'tempTables'
prodUniqueDF.registerTempTable("prodUniqueDF")
ratingsDF.registerTempTable("ratingsDF")
として登録され、私は、コード
val testSql = sql("SELECT prodUniqueDF.uid, ratingsDF.custid, ratingsDF.ratings FROM prodUniqueDF, ratingsDF WHERE prodUniqueDF.prodid = ratingsDF.prodid")
を実行しますが、エラーはのように来る:
org.apache.spark.sql.AnalysisException: Table not found: prodUniqueDF; line 1 pos 66
してください助けて!どうすれば参加できますか?代わりにRDDをマッピングする別の方法がありますか?
私のDataFrame knowldgeは素晴らしいものではありませんが、Dataframesに参加する方法が役立つでしょうか? –