approxQuantile
メソッドを使用して計算しようとすると、私のスパークデータフレームに1つのcsvファイルがロードされましたが、エラーが発生します。異なるデータセットと異なる列、probablibities、およびrelativeErrorで試行します。何が起こっているのか理解してください。 Pyspark approxQuantile throwing error
df.approxQuantile("column_name", [0.2,0.3,0.6,1.0], 0)
私は、次のエラーを取得しています:
py4j.protocol.Py4JError: An error occurred while calling o30.approxQuantile. Trace: py4j.Py4JException: Method approxQuantile([class scala.collection.immutable.$colon$colon, class scala.collection.immutable.$colon$colon, class java.lang.Double]) does not exist at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:318) at py4j.reflection.ReflectionEngine.getMethod(ReflectionEngine.java:326) at py4j.Gateway.invoke(Gateway.java:272) at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132) at py4j.commands.CallCommand.execute(CallCommand.java:79) at py4j.GatewayConnection.run(GatewayConnection.java:214) at java.lang.Thread.run(Thread.java:745)
あなたのデータ型は、( 'df.printSchema()')何ですか? 整数(真= NULL可能)| - :整数(真= NULL可能) |:| - - B: 整数(真= NULL可能)F J - | – MaFF
すべての列がタイプの "整数" ルート です-l:integer(nullable = true) -e:整数(nullable = true) -c:整数(nullable = true) | - g:整数(NULL可能= true) | -h :整数(nullable = true) - m:整数(nullable = true) | - a:整数(nullable = true) | - k:整数(NULL可能= true) | d:整数(nullable = true) | - i:integer(nullable = true) –