data-cleaning

    0

    2答えて

    私はRを使ってデータセットのエラーを判断しようとしています。データセットは、1列の時間(秒)と、別の列で「実行」が発生したかどうかで構成されます。 RunStart列の「0」は実行の開始を示し、「1」は単なる実行の継続を示します。 以下の表の例では、実行時間間隔は10秒である必要があります。 すべての後続の値が10秒の倍数である場合に実行を開始し、これが真でないすべての行を特定することができます。

    0

    1答えて

    私は16列(変数)の大きなデータフレームを持っており、条件に応じてサイズ(レコード数)を減らす方法が必要です。 Rの中で誰かがこれを行う方法を知っているのだろうかと思います。 これに基づいてファイルを消去する必要があります。 「従業員ID」、「年」、「月」、および「終了」の列があります。変数「Termed」は、0 = Activeおよび1 = Termedとしてコード化されています。したがって、「

    0

    2答えて

    List1は、Python 2.7を使用して画像のOCR処理を使用して作成されました。 List1 = ["ERNR'W\xe2\x80\x98IWW/ftfi M '* \xe2\x80\x98\r\n", '\xe2\x80\x98 L n 4\r\n', 'May 2001\r\n', '31 Thursday ,_,,\r\n', '(161-214)\r\n', '0700\r\n']

    1

    2答えて

    こんにちは私は特定のフレーズの前に行を削除したいと思います。私はそれを見て別の方法は、特定のセクションの開始と終了からのデータのみを保持するだろうと思います。 df <- data.frame(time = as.factor(c(1,2,3,4,5,6,7,8,9,10,11,12,13)), type = c("","","GMT:yyyy-mm-dd_HH:MM:SS_LT:

    0

    1答えて

    私はRで作業しています。私は2つのデータフレームを持っています。私の目標は、2つの列に基づいてそれらをマージし、最初のデータフレームからマージされた行を削除することです。ですから、例えば、私は次のようなもので開始した場合:に基づいてマージした後 A: x y z 1 2 3 4 5 6 B: q x y 7 1 2 3 8 9 (x、y)とAから一致

    0

    1答えて

    数字変数の4番目の数字の0がNAになるような値が必要です。 次のコードは、私の試みです: dataframecolumn[which(substring(dataframecolumn) != %%%0)] = NA しかし、私はそれを動作させることはできません。誰かが私にこのことを助けることができますか?

    3

    1答えて

    私はここで清掃の状況を抱えています。古いプログラマは、使用していないデータベース&をクリーンアップしませんでした。 データベースのいくつかは外部サイト(他のftpサーバー上)でまだ使用されていますが、時代遅れでシステムを乱雑にしているものもあります。 私の質問は:どのように私はウィッヒデータベース(&ユーザ)は他のウェブサイトで使用されてまだ されている把握することができますか? (今までにこれが

    0

    1答えて

    したがって、dd.mm.yyyyと表示されているいくつかの日付を抽出しようとしています。 細胞のいくつかは、一つだけの日付が含まれている、そのうちのいくつかは、私は気にしないより多くの文章とともに、(DD.MM.YYYYへDD.MM.YYYYからのような)複数の日付が含まれています。 「From」と「To」の2つの列を作成するには、両方の日付を抽出する必要があります.1つの日付で発生したイベントの

    -1

    1答えて

    特定のデータベースにさまざまな条件付き書式設定を実装しようとしています。ここで答えを探しましたが、類似のものは見つかりませんでした。可能ではないかもしれませんが、試してみる価値があります。 私は、さまざまなデータのクレンジングと検証を行っています。ここで がケースである:(小さなサンプル、この特定のファイルに100kのデータエントリでの作業) 最終的に私が欲しいものを「最後の後に、低レベルの説明の

    -1

    1答えて

    私はさまざまなノミネートと賞を獲得した賞の列を含むCSVファイルを持っています。私はこのデータセットの賞の列からデータを抽出し、それを複数の列に分割したいと考えています。賞には勝利、一般的にはノミネート、特定のカテゴリー(例えば、オスカー、BAFTAなど)での勝利とノミネートの詳細があります。受賞欄の入力例を以下に示します。 Click here for Input image そして私は、データ