大きな文字列があり、開始と終了の検索パターンでパターンを一致/抽出したい。これはどのようにしてRで行うことができますか?Rを使用して大きな文字列でパターン(開始点と終了点)を抽出するにはどうすればよいですか?
文字列の例:
big_string <- "read.csv(\"http://company.com/students.csv\", header = TRUE)","solution":"# Preview students with str()\nstr(students)\n\n# Coerce Grades to character\nstudents$Grades <- read.csv(\"http://company.com/students_grades.csv\", header = TRUE)"
そして、私はこのインスタンス内のURLの成分を抽出したいです。したがって、パターンはhttp
で始まり、.csv
または任意の拡張子(可能な場合)で終わります。
http://company.com/students.csv
http://company.com/students_grades.csv
私は、パターンを抽出するためにgregexpr
を使用して多くの試みとは運を持っていません。誰かがRでこれを行う方法を出すのを助けることができますか?
あなたで終わります質問は明確ではない。それは常にURLを抽出するのだろうか?常に最初と最後のURL?常に引用符で囲みますか? – G5W