テキストを含むスパークデータフレームの列があります。 特殊文字'@'で始まるすべての単語を抽出し、そのテキスト列の各行からregexp_extractを使用しています。テキストに'@'で始まる複数の単語が含まれている場合は、最初のテキストのみが返されます。 私はスパークのパターンに一致する複数の単語を抽出したいと考えています。 data_frame.withColumn("Names", rege
列内の文字の4番目のインスタンスまでのテキストをどのように抽出できますか? filter_typeから4番目の>文字までのテキストを選択しています。これを実現するために 、私は第四>文字の位置を見つけるためにしようとしてきたが、それは働いていない: select substring(filter_type from 1 for position('>' in filter_type))
私はSQLログを使ってたくさんのファイルを持っています。私は次のパターンのすべての出現を抽出するために外を見てい SQLログは、私がlogs_で始まるファイルをスキャンして、その後、すべてのユニークなテーブルを抽出したいこの sel *
from DB.T1;
update DB.T1;
delete from DB.T2;
collect stats on
DB.T3 index (a