Iが基準マネージャMendeleyによって生成された マッチ、可能秒コンマとスペースと[A-Z]正規表現
Author_1999.pdf
Authorone, Authortwo_1999.pdf
Authorone, Authortwo, Authorthree.pdf
Arian, Nachmias, Amir_2002.pdf
Author, Review, Source_2015(2).pdf
Avraham, Hacohen_1930.pdf
名前のファイルを持っています。 Authorone1999.pdfまたはAuthorone1999(2).pdfの形式ですべてが必要です。私は、私もオプションの最初のカンマ空間Authortwoに一致させるにはどうすればよいだけで、最後のコンマスペースの作者に一致する正規表現と_
/(,)+[A-z ]*,?[A-z]*,?-?[A-z]*_/
を持っています。
Authorone, et al._1999.pdf
と私は既にそれらを整理しているので、2つ以上のカンマがありません。
/, +[A-Za-z-]+(?:, [A-Za-z-]+)?(?:, [A-Za-z-]+)?_/
'Authorone、Authortwo、Authorthree.pdf'には年がありません。これをどう扱う? – anubhava
削除する[A-Z]の最後に「_」がないので、一致させたくありません。このような少数だけあり、私は手でそれらをしなければならないでしょう。終了年 'files = Dir ['*']のファイルのみを照合します。select {| x | x =〜/d*.pdf/} ' –
regexrを使わないでください。[rubular](http://rubular.com)を使ってRuby正規表現をテストしてください。 –