2016-08-18 5 views
0

私は参加したいが、大きな紆余曲折を持つ2つのデータセットをExcelに持っています。ここに私のデータがどのように見えるかです:Rapidminerに参加する

enter image description here

物事のカップルを注意してください:ID 3の 1- Sheet1の中に電話がSheet2のでは異なっています。 2 - ID4の場合、シート2に電話番号がありますが、シート1には電話番号がありません。

私が望むのは、すべての情報を含む2枚のシートの組み合わせです。したがって、欠損値が入力され、同じIDに対して2つの異なる値がある場合は、別の値(たとえば、phonenumber1、phonenumber2)を含む追加の列を作成するようにします。

注記私は非常に技術的な人ではないので、単純な解決策があるかどうか、それが複雑であれば、私が詳細に行う必要がある手順を説明してください。

THX!

答えて

1

Joinオペレータは、パラメータを正しく設定した場合、必要な操作を行います。まず、スプレッドシートを読み込んだ後、両方のサンプルセットをJoinオペレータに接続します。この演算子のkey attributesを左右のキーの両方にIDageに設定します。次に、remove double attributesパラメータをクリアします。

プロセスを実行すると、追加の列が表示されます。

関連する問題