pysparkでパーセンテージの頻度を取得しようとしています。pysparkでパーセンテージの頻度を取得する方法
私はここから%の周波数を取得するにはどうすればよい# Dates in descending order of complaint frequency
df.createOrReplaceTempView('Comp')
CompDF = spark.sql("SELECT Company, count(*) as cnt \
FROM Comp \
GROUP BY Company \
ORDER BY cnt DESC")
CompDF.show()
+--------------------+----+
| Company| cnt|
+--------------------+----+
|BANK OF AMERICA, ...|1387|
| EQUIFAX, INC.|1285|
|WELLS FARGO & COM...|1119|
|Experian Informat...|1115|
|TRANSUNION INTERM...|1001|
|JPMORGAN CHASE & CO.| 905|
| CITIBANK, N.A.| 772|
|OCWEN LOAN SERVIC...| 481|
:非常に簡単です
Companies = df['Company'].value_counts(normalize = True)
は、周波数の取得次のように私はpyhtonでこれをやりましたか?私はあまり運がないものをたくさん試しました。 ご協力いただければ幸いです。
どのようにトータルの使用についてパーセントを計算するために数えます。 – Suresh
あなたが答えを見つけた場合は、親切にそれを受け入れる - ありがとう – desertnaut