data-cleaning

    0

    1答えて

    私はANNを介してデータを実行したいと私はユニークな番号をこれらのユニークな値を交換する必要が df.wlan_mgt_fixed_reason_code.unique() = array(['?', '0x0002', '0x0003', ..., '0x0c3c', '0xbf17', '0x4cee'], dtype=object) の下のようなパンダのデータフレームの悪魔を持っている

    0

    2答えて

    の列に表示されて単語を区切っ私は、次の df = Number Words 1 [email protected], Mango , !!!,Banana,... 2 G###,Clutter image, Focus^& yourself,.. 3 .... のように見えるのデータフレームを持っているこれは巨大であり、実際のデータフレームを模倣する小さな例です。私はそれをきれい

    1

    1答えて

    私は以下のようにデータフレームxを持っています。私はデータフレームyに変換したい。 x <- data.frame(x=c("100A", "200B", "300C")) y <- data.frame(x=c(100, 200, 300))

    1

    1答えて

    私は、データを読み出すたデータセット、df.dir.value_counts()戻り 169 23042 170 22934 168 22873 316 22872 315 22809 171 22731 317 22586 323 22561 318 22530 ... 0.069 1 0.167 1 0557 1 0.093 1

    0

    1答えて

    小売店で毎週記録された支出を伴う消費者パネルデータがあります。固有IDは世帯IDです。私は、支出に5つ以上のゼロがある場合、観測値を削除したいと思います。つまり、世帯は5週間は何も買っていませんでした。一度特定されると、私は世帯のIDに関連するすべての観測を削除します。誰もが私はこの手順をSASで実装する方法を知っていますか?ありがとう。

    0

    1答えて

    でクリーン/文字列が一貫作ります。これらは会社名であり、これらのほとんどは手動で入力されたため、タイプミスや表現形式が異なります。 company_name big compnay big company big company inc. smll compny small company small inc. 私は以下のようなものに上記の列を編集しようとしています: compan

    0

    2答えて

    与えられた単語と一致する順列を探し、列の位置に基づいてデータを整列したい。 IE - 私はそれがこのようなものになります、私はいくつかのwebsites.Sayから廃棄データをCSVを作成しました。その後、私は(1)Name2はで名1から各単語の順列を見つけたい Name1 OtherVars Name2 More Vars Stanford 23451 Mamford No MIT

    -2

    2答えて

    StackOverflowの最初の投稿!私はRの初心者であり、データサイエンスのためにそれを学ぶためのいくつかのオンラインコースを行っています。私はggplot2を使って時系列解析や可視化に使用できるように、データのフォーマットを整える手助けをしてくれることを願っています。私は検索を試みましたが、用語知識がまだ不足しているときには、良い検索をするのは難しいです(データの操作、munging、wra

    1

    2答えて

    データフレームから因子列のみを選択しようとしています。例は次のとおりです。 bank[,apply(bank[,names(bank)!="id"], is.factor)] しかし、コードは奇妙な動作をします。ステップバイステップ: sapply(bank[,names(bank)!="id"], is.factor) 私が取得: age sex region income m