2017-05-06 14 views
-1

これは私がやろうとしていることです。スプレッドシートにあるAmazonデータを操作する必要があります。ここで私は(引用符は、実際のスプレッドシートのセルの内容の一部ではない)のスプレッドシートを持っているテキストの最初のセルの例です:Regex - ダイナミックな文字グループの前後のすべてを検索

「#864 ツール&ホームインプルーブメント(トップ100)に」

カテゴリの前後(太字)はすべて削除する必要があります。カテゴリは変更されます - すべてのスプレッドシートセルで同じではありません。上記の例では、 "#864 in"の数字を削除する必要があります(数字には常にポンド記号が続き、数字は... 1〜数百万、その後にスペース、その後に "in"、別のスペースが続きます) 。

また、カテゴリの直後には常に「(トップ100)」が表示されます。私はそれを見つけ出す必要があります(そして最終的には削除してください)。そして、セル内の他のものがたくさんあります。( "Top 100"の後にはたくさんのものがあります。 /段落など)。

カテゴリのみが必要です。私は立ち往生している!うまくいけばそれは理にかなっている。どんな助けもありがとう。ありがとう。 Googleスプレッドシートで

+0

試したことの例がありますか?あなたはどの言語を使っていますか? Visual Basicまたは他の何か? –

+0

あなたは使用している言語で投稿にタグを付ける必要があります。 –

+0

私は特定の言語を使用していません。私はちょうど正規表現の検索オプションを持ってGoogleのスプレッドシートの検索と置換のオプションを使用しています。 – user1074239

答えて

0

検索:^#\d+ in (.*) \(Top 100\).*

置き換えます$1

+0

私はそれを試みた。運がない。しかし、ありがとう。 Googleスプレッドシートで検索と置き換えを行っています。だから、カテゴリの前後にあるものをすべて見つけて、カテゴリの前後にあるものを何も置き換えないでください。そうすることで、カテゴリ内のセル内のすべてが削除されます。 – user1074239

+0

Googleスプレッドシート専用に更新されました。私のためにあなたのサンプルストリングで働いた! –

+0

これは完璧に動作します;-)私が今行っている唯一の問題は、「(Top 100)」の後にたくさんのものがあることです。スクリーンショットは次のとおりです:https://www.evernote.com/l/ABgP6UxFjI9FHqmTiUyPnqZzGRZCzDpVjks各セルには、削除する必要がある他のものもあります。あなたは正規表現を微調整することができますか? – user1074239

0

最初の要件: は、トップ100の後に余分な行を削除するには

検索:^#[\d,]+ in (.*) \(Top 100\)[\s\S]*

置き換え$1

また、開始番号にカンマがあると正規表現が含まれていなかったため、修正も含まれていたことに気付きました。 $1

を交換し [\s\S]*?([\d,.]+)$

検索:最後の数以外のセルのすべてを削除するには:今では第二の必要条件など「に...#10286」

にでもと一致します

置き換え468分の467個の細胞

注:はデータの周りプレイし、両方の正規表現は思えますうまく動作するように。正規表現置換を実行する前に、正しい列を選択してください。また、最初のものは持っていない細胞(Top 100)では機能しないことに注意してください。正規表現と

デモシート表現の上使用して行わ置き換えますlink

・ホープ、このことができます!

+0

ありがとうございました!それは完璧に働いた。 :-)私は正規表現についてもっと知りたいと思っています。それは本当に便利です。 – user1074239

+0

regexはhttp://www.rexegg.com/から入手できます。私の答えがあなたの問題を解決する助けとなったら、それを受け入れられた答えとしてマークしたいかもしれません。ありがとう! – degant

関連する問題