duplicates

    -2

    2答えて

    データフレーム内の2つの行を1つに結合したいが、エントリの複製は避けてください。それは私がこれから移動したいされています。これに RowA RowB A,B A,B,C A A :tidyrから団結使用 RowA RowB RowC A,B A,B,C A,B,C A A A 、私が実際に取得していますと、次のとおりです。 RowA RowB RowC A,B

    0

    2答えて

    こんにちは、私はpythonに新しいので、友人はstackoverflowのヘルプを求めることを勧め、私はそれをショットを与えることにしました。私は現在、Pythonバージョン3.xを使用しています。 カラムヘッダーのないcsvファイルに100kを超えるデータセットがあります。このデータをpandas DataFrameにロードしました。ため、私は、私は ここにデータを表示するカントが、これはあな

    1

    1答えて

    こんにちは私はPythonには新しく、現在はPythonバージョン3.xを使用しています。私はcsvでフィルタリングするために必要な非常に大きなデータセットを持っています。私はオンラインで検索し、多くはpandas DataFrameにロードすることを推奨しました(完了)。 私の列のように定義することができます:「ID」、「名前」、「時間」、私は任意の重複を「トークン」の下にチェックする必要があり

    1

    3答えて

    申し訳ありませんが、私は良い解決策を提示するように見えません。私はオンラインで調査を行っていますが、私の限られた経験で私は私が何であるか把握できませんでした間違っている。 私は重複している600000以上のレコードを持っており、レコードには正確に重複していない他の多くのフィールドがあるため、最大のID番号に基づいて重複を削除する必要があります。助けてください。 サンプルでは、​​私はそれがこの

    0

    1答えて

    重複行の削除/更新に関するその他の記事を見てきましたが、私の特定の苦境に正しく適用する方法について少し混乱しました。 誰かが私に正しい方向へのプッシュを与えることを望んでいた。 私は、それにいくつかの重複行を持つテーブルがあると論理的に私のテーブルは、符号なしのbigintであるidという主キーを持つ1. にisdeleted列を設定することにより、各ユーザーのためにそれらを削除したいです複製され


    0

    2答えて

    APIを使用してWebサイトからチケット番号をダウンロードし、作成した一意のチケットIDを1つのIDインスタンスのみを受け入れるようカウントします。 これは非常に遅いです...私はセットを使用しようとしましたが、それは悪化しています。私はitertoolsなどの他のツールについては言及していますが、私のような状況でどのように使用できるかについて明確な説明はありません。 良い変数と悪い変数は、私が知