でクリーン/文字列が一貫作ります。これらは会社名であり、これらのほとんどは手動で入力されたため、タイプミスや表現形式が異なります。 company_name
big compnay
big company
big company inc.
smll compny
small company
small inc.
私は以下のようなものに上記の列を編集しようとしています: compan
与えられた単語と一致する順列を探し、列の位置に基づいてデータを整列したい。 IE - 私はそれがこのようなものになります、私はいくつかのwebsites.Sayから廃棄データをCSVを作成しました。その後、私は(1)Name2はで名1から各単語の順列を見つけたい Name1 OtherVars Name2 More Vars
Stanford 23451 Mamford No
MIT
データフレームから因子列のみを選択しようとしています。例は次のとおりです。 bank[,apply(bank[,names(bank)!="id"], is.factor)]
しかし、コードは奇妙な動作をします。ステップバイステップ: sapply(bank[,names(bank)!="id"], is.factor)
私が取得: age sex region income m