stringr

    1

    1答えて

    下記のattributes.txtファイル(Sawtooth調査調査からの出力)を解析して、出力結果が下図のようになるようにします。あなたは私の試みを以下で見ることができます。できます。しかし、それは非常に醜いです。より良い方法が必要でしょう、そうですか?パースから ==================================================================

    -1

    2答えて

    私はスクラップされたデータを使ってデータフレーム(Catcher2)を持っています。 MarketValueの列については、私は各人の価格が好きです。 40,00ミル。 € 私はgsub()を使用しようとしましたが、 '€'を過ぎてすべての情報を削除することはできません。また、プレイヤー間で日付が異なるという問題もあります。したがって、日付ごとにコードラインではなく、データフレーム全体を実行するた

    0

    1答えて

    私はpdftoolsを使っていくつかのpdf文書をtxtに変換しました。これは、出力の一部である(それはそう悪くはない) REPÚBLICA DE CHILE PADRON ELECTORAL AUDITADO ELECCIONES PRESIDENCIAL, PARLAMENTARIAS y de CONSEJEROS REGIONALES 2017 REGISTROS: 2.42

    2

    1答えて

    以下のような文字列から大括弧を削除しようとしています。 library(stringr) x <- "(Verhoeff,1937)" str_replace(string = x, pattern = "(\\()|(\\))", replacement = "") [1] "Verhoeff,1937)" gsub(pattern = "(\\()|(\\))", replace

    2

    1答えて

    次のデータセットがあります。 devtools::reproduce()を使用してここにデータのサンプルを入れました。私は助けが必要な列を選択しました。これはgenresです。 下記のジャンルが多数あります。私は映画データベースを扱っており、そこにリストされている最初のジャンル(このフォーマットはGenre1 | Genre2 | Genre3)だけを使いたいと思っています。 stringrまたは

    1

    1答えて

    私は、関数を記述しようとしています。または、適用ファミリを使用して、探している単語を含むデータフレームの行を選択し、それらをタグのようにマークしています。行には複数のタグがあります。誰かが私を助けてください、私はしばらく固執されていることができます。 質問が不明な場合、または回答がある場合は、正しい方向に案内してください。とても有難い! require(stringr) require(dply

    1

    1答えて

    文字列内の人の固有の名前を数えて、わずかなタイプミスがあるかもしれないということを考慮する必要があるという問題に取り組んでいます。 文字列を一定のしきい値(たとえば、2より下のレベンションの距離)以下に設定することを考えました。今は文字列の距離を計算することができますが、入力文字列に変更を加えずに、正しい数の一意の名前を得ることができます。 library(stringdist);library(

    0

    1答えて

    列内の各観測値が "x〜y"という形式の文字列である場合、xとyは整数です。 「x〜y」文字列を、整数xで始まり整数yで終わる数字のシーケンスであるベクトルc(x..y)に変換することです。 最後に、ベクトルの各要素が独自の行を取得し、他の列が適切に繰り返されるように、データフレームをネストしないようにする必要があります。 例えば、ここではデータフレームです: A B A1 -1~1 A2

    0

    1答えて

    文字列のサブセット束にパターンを構築するためにstringrとrebusを使用しようとしています。私が得たいと思っている文字列は共通点があり、それらはすべて同じ桁で始まり、終わりです。データ位置15と22の例は、私がサブセットしたいものを示しています。これらの数字は、(私は、彼らが同じでなければならないという声明を作っていないよということを知って、私はどのように知りません)私は仕事だろうと思ったも