スカラ座で異なる2つのデータフレームやプリント列を比較しますどのように我々はここで2つのデータフレームを持って
予想されるデータフレーム:
+------+---------+--------+----------+-------+--------+
|emp_id| emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+---------+--------+----------+-------+--------+
| 3| Chennai| rahman|9848022330| 45000|SanRamon|
| 1|Hyderabad| ram|9848022338| 50000| SF|
| 2|Hyderabad| robin|9848022339| 40000| LA|
| 4| sanjose| romin|9848022331| 45123|SanRamon|
+------+---------+--------+----------+-------+--------+
と実際のデータフレーム:
+------+---------+--------+----------+-------+--------+
|emp_id| emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+---------+--------+----------+-------+--------+
| 3| Chennai| rahman|9848022330| 45000|SanRamon|
| 1|Hyderabad| ram|9848022338| 50000| SF|
| 2|Hyderabad| robin|9848022339| 40000| LA|
| 4| sanjose| romino|9848022331| 45123|SanRamon|
+------+---------+--------+----------+-------+--------+
2つのデータフレームの違いは次のとおりです。
+------+--------+--------+----------+-------+--------+
|emp_id|emp_city|emp_name| emp_phone|emp_sal|emp_site|
+------+--------+--------+----------+-------+--------+
| 4| sanjose| romino|9848022331| 45123|SanRamon|
+------+--------+--------+----------+-------+--------+
except関数df1.except(df2)を使用していますが、この問題は、異なる行全体を返します。私たちが望むのは、その列内でどの列が異なるかを見ることです(この場合、 "romin"と "emp_name"の "romino"は異なります)。私たちはそれに多大な困難を抱いており、どんな助けも素晴らしいでしょう。
内部結合とemp_nameの両方を保持し、両方が同じであるすべての行を削除します。 –
データを前提とすることはできますか?たとえば、emp_idが一意であると想定できますか?またはそれ以上のものが同じでなければならず、そのデータの検証だけが関連していますか?さもなければ、なぜこの行がemp_nameで異なっていて、他のemp_idと完全に異なっていないのですか? –
類似した質問https://stackoverflow.com/questions/44807450/how-to-compare-two-dataframes-and-print-extra- 44810081#44810081 –