data-cleaning

0熱

1答えて

私はANNを介してデータを実行したいと私はユニークな番号をこれらのユニークな値を交換する必要が df.wlan_mgt_fixed_reason_code.unique() = array(['?', '0x0002', '0x0003', ..., '0x0c3c', '0xbf17', '0x4cee'], dtype=object) の下のようなパンダのデータフレームの悪魔を持っている

0熱

2答えて

クリーニングコンマはR

の列に表示されて単語を区切っ私は、次の df = Number Words 1 [email protected], Mango , !!!,Banana,... 2 G###,Clutter image, Focus^& yourself,.. 3 .... のように見えるのデータフレームを持っているこれは巨大であり、実際のデータフレームを模倣する小さな例です。私はそれをきれい

1熱

1答えて

Rで英数字の文字列を数値に変換するにはどうすればよいですか？

私は以下のようにデータフレームxを持っています。私はデータフレームyに変換したい。 x <- data.frame(x=c("100A", "200B", "300C")) y <- data.frame(x=c(100, 200, 300))

1熱

1答えて

パンダ：非整数データをドロップし

私は、データを読み出すたデータセット、df.dir.value_counts()戻り 169 23042 170 22934 168 22873 316 22872 315 22809 171 22731 317 22586 323 22561 318 22530 ... 0.069 1 0.167 1 0557 1 0.093 1

0熱

1答えて

SASソフトウェア：従属変数の5つ以上のゼロを含む観測値を削除する方法

小売店で毎週記録された支出を伴う消費者パネルデータがあります。固有IDは世帯IDです。私は、支出に5つ以上のゼロがある場合、観測値を削除したいと思います。つまり、世帯は5週間は何も買っていませんでした。一度特定されると、私は世帯のIDに関連するすべての観測を削除します。誰もが私はこの手順をSASで実装する方法を知っていますか？ありがとう。

0熱

1答えて

は、私が「汚れ」の文字列の列を持つデータセットで働いているパンダ

でクリーン/文字列が一貫作ります。これらは会社名であり、これらのほとんどは手動で入力されたため、タイプミスや表現形式が異なります。 company_name big compnay big company big company inc. smll compny small company small inc. 私は以下のようなものに上記の列を編集しようとしています： compan

0熱

2答えて

他の列の単語の同様の順列を見つける

与えられた単語と一致する順列を探し、列の位置に基づいてデータを整列したい。 IE - 私はそれがこのようなものになります、私はいくつかのwebsites.Sayから廃棄データをCSVを作成しました。その後、私は（1）Name2はで名1から各単語の順列を見つけたい Name1 OtherVars Name2 More Vars Stanford 23451 Mamford No MIT

-2熱

2答えて

時系列解析と視覚化のためにこのデータを再フォーマットするためのコードは何ですか？

StackOverflowの最初の投稿！私はRの初心者であり、データサイエンスのためにそれを学ぶためのいくつかのオンラインコースを行っています。私はggplot2を使って時系列解析や可視化に使用できるように、データのフォーマットを整える手助けをしてくれることを願っています。私は検索を試みましたが、用語知識がまだ不足しているときには、良い検索をするのは難しいです（データの操作、munging、wra

1熱

2答えて

R - データフレームの因子列のみを選択する

データフレームから因子列のみを選択しようとしています。例は次のとおりです。 bank[,apply(bank[,names(bank)!="id"], is.factor)] しかし、コードは奇妙な動作をします。ステップバイステップ： sapply(bank[,names(bank)!="id"], is.factor) 私が取得： age sex region income m