stringr

    2

    1答えて

    私の会社は、各クライアントのポリシー/サービスの要約をpdf形式のファイルで文書化しています。これらのファイルは、毎年大きなデータセットに結合されます。クライアントごとに1つの行と列は、クライアントのドキュメント内の変数です。数千のファイルがあり、それぞれに約20-30個の変数があります。クライアントを表す各行でdata.frameを作成し、各クライアントの変数をpdfドキュメントから取得すること

    0

    1答えて

    私は人の名前である2つの列を持つデータフレームを持っています。以下のコードを使用してテーブルを生成します。 names.1=c('Ron ven goh','Phil Mick' , 'Rohan Aggarwal','John Deo Lin') names.2=c('Rob ven goh','kitty Mol','Tejas Aggarwal','Jorge Mol Lin') df=

    3

    2答えて

    私は、長い(長い)文字列が多数あるdata.frameを持っています。私はそれらを処理する前にそれらを少しきれいにしようとしていますが、私はピリオドを扱うときに問題に遭遇しました。私は、文章を終わらせるためにピリオドが使われるときと、それが略語の一部として使われるときを区別できるようにしたい。私は単語の長さでこれをやりたいですが、それのための正しい正規表現を考え出していない。 私はこのような文字列

    1

    1答えて

    私は多くのテキストファイルを持っています。各テキストファイルには、以下のような関心のあるセクションがあります。 <tr> <td ><b>发起时间</b></td> <td colspan="2" style="text-align: left">2015-04-08</td> <td style="width: 25%;"><b>回报机制</b></td>

    2

    2答えて

    R(v3.4.1)の文字列から緯度、経度、ラベルを抽出しようとしています。私の考えは、正規表現が行く方法であり、stringrパッケージにはキャプチャグループを抽出する機能があるので、これは使用するパッケージだと思っていました。問題は、私が解釈できないというエラーを受けていることです。どんな助けもありがとう。 ここに、情報を抽出したい文字列の例を示します。ラベル(Adelbert Hall)ととも

    3

    2答えて

    文字の間に空白を入れて、同じ文字列のさまざまなバージョンを返す関数を作成しようとしています。以下のような 何か: input <- "word" 返す: w ord wo rd wor d

    1

    1答えて

    "string1"という文字列内のテキストを部分的に置き換えようとしています。 私が見て、テキストの同じ文字列に置き換えたい「LocateMe」に含まれる複数のパターンがあります:「!= -9999」 複数のパターンのような特殊文字を含む非常に複雑です"="と "[" gsubを使用してこれを達成することは可能ですか、別の機能を使用する必要がありますか?どんな指針も大変ありがとうございます。 st

    3

    3答えて

    私は私の質問が少し曖昧であることを知っているので、私は何をしようとしているのかの例を持っています。 input <- c('I go to school') #Output '"I " * phantom("go to school")' 'phantom("I ") * "go" * phantom("to school")' 'phantom("I go ") * "to" * ph

    3

    3答えて

    私は非常に乱雑な文字列のベクトルを持っています。だからここに私がまたは、正しくその後、いくつかのより多くのテキストを入力してもしなくてもよい時間に続いて、いくつかのテキストを、特色の文字列を持っている library(tidyverse) library(stringr) strings <- tibble( name = c("lorem 11:07:59 86136-1-sed",

    1

    2答えて

    にキャピタル・手紙を見つけ、例えば各文字列 のためにそこにあるどのように多くのカウント t = c("gctaggggggatggttactactGtgctatggactac", "gGaagggacggttactaCgTtatggactacT", "gcGaggggattggcttacG") ldply(str_match_all(t,"[A-Z]"),length) 上記の関数を適用す