あなただけの言葉を探していた場合は、tokenize(., '\s+|\p{P}')
<xsl:template match="Data">
<xsl:copy>
<xsl:variable name="words" select="tokenize(., '\s+|\p{P}')"/>
<xsl:for-each select="'brown', 'over', 'dog'">
<matched item="{.}" at-pos="{index-of($words, .)}"/>
</xsl:for-each>
</xsl:copy>
</xsl:template>
を使用することができます
<Data>
<matched item="brown" at-pos="3"/>
<matched item="over" at-pos="6"/>
<matched item="dog" at-pos="9"/>
</Data>
を与えるので、要素の名前はあなたが投稿ここで、(私は確認していない権利ポジションを持っています(hop
のように)私はそれを実装しようとしていないので、取得する必要があります。
句読点の文字を識別したいと思うので、私はトークンサイズが十分ではないと思っています。また、analyze-stringであっても、一致して位置を収集するのは簡単ではありません。たぶん誰かが良いアイデアを持っているかもしれません。
ようこそ、@ user918368 xslt-1.0と-2.0の両方をタグ付けしていますので、正確に何を使用していますか? 2.0の場合、1.0タグを削除することができます –
はい、私はv2.0を使用しています。ありがとうございます – user7918368