から一致列は、私は別のデータフレームが最初のデータフレーム内の各列の係数を含むスパーク2つのデータフレーム
+---+---+------+---+
| sp|sp2|colour|sp3|
+---+---+------+---+
| 0| 1| 1| 0|
| 1| 0| 0| 1|
| 0| 0| 1| 0|
+---+---+------+---+
以下のようなフォーマットのデータフレームを有します。たとえば
+------+------+---------+------+
| CE_sp|CE_sp2|CE_colour|CE_sp3|
+------+------+---------+------+
| 0.94| 0.31| 0.11| 0.72|
+------+------+---------+------+
ここで、2番目のデータフレームからスコアを加算して計算される最初のデータフレームに列を追加します。
ex。
+---+---+------+---+-----+
| sp|sp2|colour|sp3|Score|
+---+---+------+---+-----+
| 0| 1| 1| 0| 0.42|
| 1| 0| 0| 1| 1.66|
| 0| 0| 1| 0| 0.11|
+---+---+------+---+-----+
すなわち
r -> row of first dataframe
score = r(0)*CE_sp + r(1)*CE_sp2 + r(2)*CE_colour + r(3)*CE_sp3
列と異なっていてもよい列の順序のn個存在し得ます。
ありがとうございました!!!
ので、あなたの第二のデータフレームは、4つの値で、実際に1行が含まれていますか? – eliasah
@eliasahの値は増加する可能性がありますが、2番目のデータフレームでは行の数は常に1に留まります。 – nareshbabral
実際には2番目のDataFrameは必要ありません – eliasah