WebページからURLを取得し、そのWebページをフォルダ内の.htmlファイルとしてデスクトップに保存しました。今私はそれらの同じ.htmlファイルを使用し、私の次のプログラムへの入力としてそれらを設定する必要があります。私の質問は、仕事の残りの部分を行う関数への入力として約400以上のこれらのファイルをすべてどのように取得するのですか?私はまた、現在Python 2.7で作業していますが、私はそれを使用する必要がある場合、私は最新のpythonを利用できます。Python:多くのファイルを入力として使用する
答えて
あなたの第二の機能はそうのようなファイル名のリストを取ることができる:
def process(files):
for f in files:
# do stuff
そして、あなたはあなたがすべてのファイルを返すようにglob.glob()
を使用することができます
import os
files = os.listdir('/path/to/files')
私のファイルがhtmlの場合でもこれを使用できますか?私はそれらを開いて読まなければならないので、私はまだurlopen(ファイル)が必要でしょうか? –
Pythonはあなたのファイルの内容を気にしません。問題はあなたのマシンにローカルに保存されているhtmlファイルですか?そうであれば、 'urlopen'は不要です。なぜならあなたは' open'を使ってそれらを読むことができるからです。 – thaavik
はい私はファイルを開いている(パス)今私の現在の問題は、parapraphsテキストのみを取得し、それをトークン化しようとしているので、フォルダに格納されているファイルを持っている。私はトークン化するためにntlkを使用していますが、まず段落タグから正しいテキストが必要です。私は美しいスープを試しています.find_all( 'p') –
を実行して、ファイルのリストを取得することができますパターンと一致するパス名を指定してから、すべてのファイルを繰り返し処理して1つずつ処理します。
これはあなたの問題
import os
for root, dirs, files in os.walk(yourpath, topdown=False):#topdown traversing
for name in files:
print(os.path.join(root, name))
stuff
for name in dirs:
print(os.path.join(root, name))
stuff
- 1. fisher.test多くのファイル入力
- 2. ファイル入力を使用して整数を入力する
- 3. raw_input()を使用して多数の数値を入力してください
- 4. pythonを使用してword.docxをExcelファイルから自動入力
- 5. Shakeを使用した多入力多出力コンパイラ
- 6. NameError使用して入力のPython 2.7
- 7. txtファイルを入力として使用してRDFファイルを作成する
- 8. 入力としてcsvファイルを使用してRDFファイルを作成する
- 9. Pythonの入力としての多項式
- 10. txtファイルを入力として使用してpythonファイルを実行する方法(データ解析)
- 11. Python OpenCV - 入力としてライブカメラのフィードフレームを使用したテンプレートマッチング
- 12. カスタム入力を使用してstringの出力を多重化する
- 13. Pythonを使用してデータベースに入ってくるファイルをロードする
- 14. Pythonの入力として三角形を入力する
- 15. Selenium + Pythonを使用して入力をテストするユーザー入力を別の入力にミラーリングする
- 16. 検索メソッドpythonの属性として入力パラメータを使用
- 17. Python 2d配列の入力と地図を使用して
- 18. cppの同じプログラムで出力ファイルを入力ファイルとして使用
- 19. Flashを使用して入力ファイルのサイズを確認してください
- 20. FINDの入力としてCELLの出力を使用する
- 21. Shiny Appの入力として.xlsxファイルを使用
- 22. XTKの入力として使用するVTKファイルのファイル形式
- 23. pythonでwinmm.dllを使用して入力デバイスを取得する
- 24. pythonスクリプトを使用して端末コマンドを入力する
- 25. bs4とpythonを使用して質問にチェックボックスとテキスト値を入力する
- 26. Python:ディレクトリー名としてユーザー入力を使用してディレクトリーをリストします。
- 27. 並行Pythonを使ったクイックソート。入力としてXMLファイルを使用する必要があります
- 28. iMacrosでCSVファイルを使用してdatepickerを入力してください
- 29. シンボルをPythonの関数の入力として使用する方法
- 30. Pythonでforループを使用して入力する
'輸入OS yourpath = 'ファイルを//する。//パス' をslove必要があります。 os.listdir() '? – 9000
すべてのファイルを表示するには 'glob.glob("/path/to/*。html ")'を使用してください – haifzhan