1
データフレームに次の形式の文字列があります。pyspark regexの文字列の一致
abc.T01.xyz
abc.def.T01.xyz
abc.def.ghi.xyz
この文字列の値がこの式に一致する行をフィルタリングする必要があります。
[a-zA-Z].T[0-9].[a-zA-Z]
私は、次のコマンドを使用していたが、それは私にも、このように見える文字列を与えている:[a-zA-Z].[a-zA-Z].T[0-9].[a-zA-Z]
私は私の結果ではしたくありません。
mydf2 = mydf1.where('col1 rlike ".*\.T.*\..*"')
mydf2.show()
私の正規表現には何かがありません。
ありがとうございました。それは魅力のように働く。 – akn