stringr

1熱

1答えて

下記のattributes.txtファイル（Sawtooth調査調査からの出力）を解析して、出力結果が下図のようになるようにします。あなたは私の試みを以下で見ることができます。できます。しかし、それは非常に醜いです。より良い方法が必要でしょう、そうですか？パースから ==================================================================

-1熱

2答えて

gsub複数の行で可変パターンを置き換える

私はスクラップされたデータを使ってデータフレーム（Catcher2）を持っています。 MarketValueの列については、私は各人の価格が好きです。 40,00ミル。 € 私はgsub()を使用しようとしましたが、 '€'を過ぎてすべての情報を削除することはできません。また、プレイヤー間で日付が異なるという問題もあります。したがって、日付ごとにコードラインではなく、データフレーム全体を実行するた

0熱

1答えて

gsubを使用して大文字と小文字が区切られた複数の空白や破線を修正するには？

私はpdftoolsを使っていくつかのpdf文書をtxtに変換しました。これは、出力の一部である（それはそう悪くはない） REPÚBLICA DE CHILE PADRON ELECTORAL AUDITADO ELECCIONES PRESIDENCIAL, PARLAMENTARIAS y de CONSEJEROS REGIONALES 2017 REGISTROS: 2.42

2熱

1答えて

str_replaceは閉じ括弧を置き換えませんが、gsubは置き換えますか？

以下のような文字列から大括弧を削除しようとしています。 library(stringr) x <- "(Verhoeff,1937)" str_replace(string = x, pattern = "(\\()|(\\))", replacement = "") [1] "Verhoeff,1937)" gsub(pattern = "(\\()|(\\))", replace

2熱

1答えて

文字列の場所に基づいてテキストを解析するためにstringrを使用する必要があります

次のデータセットがあります。 devtools::reproduce()を使用してここにデータのサンプルを入れました。私は助けが必要な列を選択しました。これはgenresです。下記のジャンルが多数あります。私は映画データベースを扱っており、そこにリストされている最初のジャンル（このフォーマットはGenre1 | Genre2 | Genre3）だけを使いたいと思っています。 stringrまたは

1熱

1答えて

データフレーム内の行を繰り返し処理して、異なる単語を検出して新しい列に保存するにはどうすればよいですか？

私は、関数を記述しようとしています。または、適用ファミリを使用して、探している単語を含むデータフレームの行を選択し、それらをタグのようにマークしています。行には複数のタグがあります。誰かが私を助けてください、私はしばらく固執されていることができます。質問が不明な場合、または回答がある場合は、正しい方向に案内してください。とても有難い！ require(stringr) require(dply

1熱

1答えて

R：距離尺度で文字列を修正する（文字列リスト）

文字列内の人の固有の名前を数えて、わずかなタイプミスがあるかもしれないということを考慮する必要があるという問題に取り組んでいます。文字列を一定のしきい値（たとえば、2より下のレベンションの距離）以下に設定することを考えました。今は文字列の距離を計算することができますが、入力文字列に変更を加えずに、正しい数の一意の名前を得ることができます。 library(stringdist);library(

0熱

1答えて

データフレーム内の文字列をベクトルに変換してデータフレームをネスト解除する

列内の各観測値が "x〜y"という形式の文字列である場合、xとyは整数です。「x〜y」文字列を、整数xで始まり整数yで終わる数字のシーケンスであるベクトルc（x..y）に変換することです。最後に、ベクトルの各要素が独自の行を取得し、他の列が適切に繰り返されるように、データフレームをネストしないようにする必要があります。例えば、ここではデータフレームです： A B A1 -1~1 A2

0熱

1答えて

Rサブセット文字列stringrとrebus

文字列のサブセット束にパターンを構築するためにstringrとrebusを使用しようとしています。私が得たいと思っている文字列は共通点があり、それらはすべて同じ桁で始まり、終わりです。データ位置15と22の例は、私がサブセットしたいものを示しています。これらの数字は、（私は、彼らが同じでなければならないという声明を作っていないよということを知って、私はどのように知りません）私は仕事だろうと思ったも