私はファイルを解析して分析しようとしています。これを行うために、私はpreg_split()を使って文書を配列に分割しました。私は配列内の単語だけを必要とします(そうでなければアルファベット文字)。私が使用した正規表現は、phpのアルファベット以外の文字の正規表現とは何ですか?
$noAlpha = "/[\s]+|[^A-z]+|\W|\r/";
ですが、配列の空白のインスタンスを取得しています。私はそれが返品(\r
)とそれ以外のものとラインとしなければならないと信じています。
私は唯一の.txtファイルを使用しています。これを説明するために、正規表現に何を追加する必要がありますか?あなたはこれを試すことができ $noAlpha = "/\s+|[^a-zA-Z]+|\W|\r/";
する必要がありますあなただけのpreg_match_all 'で単語を抽出してもよい。この
を使用することができます( '〜\ p {L} +〜'、$ text、$ words) ' –
' [^ Az] 'は期待したものと一致しない可能性があります:http://stackoverflow.com/questions/4923380/difference-between -regex-az-and-a-za-z –
コメントをいただきありがとうございました。私は考慮しなかった詳細を知る助けになりました – jKim83