2017-09-26 24 views
0

私が探しているのは、フォルダ構造内のファイルを検索して、提供されている請求書の一覧を探し、新しいファイルに必要なデータをコピーすることです。私の下のスクリプトは、説明したように動作しますが、スクリプトはサブディレクトリを含む検索フォルダで窒息します。私はルートフォルダをスキャンするためにスクリプトを修正する必要があり、それはサブディレクトリファイルです。どんな考えをしたらいいか、いくつかのコード更新を試しましたが、うまくいきませんでした。ディレクトリとサブディレクトリのファイルをスキャンする

import tkinter 
import os 
import fnmatch 
from tkinter import * 
from tkinter import messagebox as tkMessageBox 
from tkinter.filedialog import askopenfilename 
from tkinter.filedialog import askdirectory 
from pathlib import PureWindowsPath 
from pathlib import Path 

#filedialog 

content = '' 
BrowsePath = '' 
SearchPath = '' 

top = tkinter.Tk() 

#********************************************************FIELDS**************************************************************************** 
#Browse entry field 
Browse1 = Label(text="Search List:").grid(row=0) 

BrowsePath = StringVar() 
BrowsePath.set("Select File Containing Invoice Numbers") 
BrowseL = Label(bd=5,textvariable=BrowsePath, width=100,relief=SUNKEN).grid(row=0,column=1) 



#Search Folder 
Searce1 = Label(text="Search Folder:").grid(row=1) 

SearchPath = StringVar() 
SearchPath.set("Select Folder to Search") 
SearchL = Label(bd=5,textvariable=SearchPath, width=100,relief=SUNKEN).grid(row=1,column=1) 



#OutputFile 
OutputL1 = Label(text="Output File:").grid(row=2) 

OutputPath = StringVar() 
OutputPath.set("File to Save Results to") 
OutputL2 = Label(bd=5,textvariable=OutputPath, width=100,relief=SUNKEN).grid(row=2,column=1) 


#********************************************************FUNCTIONS**************************************************************************** 

#Process complete function 
def GetCallBack(): 
    tkMessageBox.showinfo("Find Invoices", "Processing complete!") 


#********************************************************FILE PICKERS**************************************************************************** 

    #Select file containing list of invoices 
def GetFile(): 
    global content 
    global BrowsePath 
    filename = askopenfilename() 
    infile = open(filename,'r') 
    content = infile.read() 
    BrowsePath.set(os.path.realpath(filename)) 
    return content 

    #Select directory containing invoice files 
def SearchDir(): 
    global content 
    global SearchPath 
    pathname = askdirectory() 
    SearchPath.set(os.path.realpath(pathname)) 
    return content 


    #Creates the save file with isolated invoices 
def SaveFile(): 

    filename = os.path.abspath(os.path.join(SearchPath.get(),"Results.txt")) 

    OutputPath.set(filename) #update label with location of file 




#********************************************************READING invoice LIST FILE**************************************************************************** 


def GetPOCount(): 
    PO = [line.rstrip('\n') for line in open(os.path.realpath(BrowsePath.get()))] #isolates list of invoices 
    ponum_count = sum(1 for line in open(os.path.realpath(BrowsePath.get()))) #gets count of invoice numbers 
    return PO, ponum_count #can be indexed 


def GetFileNames(): 
    files = os.listdir(SearchPath.get()) #gets list of files 
    return files #can be indexed 

def GetFileLineCount(): 
    files = GetFileNames() 
    file_count = len(fnmatch.filter(os.listdir(SearchPath.get()),'*.*')) 
    line_count = sum(1 for line in open(os.path.realpath(os.path.join(SearchPath.get(),files[file_count-1])))) #gets count of lines in invoice file 
    return line_count, file_count 

def FindPOs(): 
    po_number = GetPOCount()[0] 
    po_counter = GetPOCount()[1] 

    print(po_number) 
    print(po_counter) 


    file_counter = GetFileLineCount()[1] 
    file_name = GetFileNames() 

    print(file_name) 
    print(file_counter) 


    # For each file 
    for filename in file_name: 
     print("Searching " + filename) 

     with open(os.path.join(SearchPath.get(),filename),'r') as content_file: 
      line_count = sum(1 for line in content_file) #gets count of lines in invoice file 
      print(line_count) 
      po_line = [line.rstrip('\n') for line in open(os.path.realpath(os.path.join(SearchPath.get(),filename)))] #isolates each line 
      result_filename = os.path.abspath(os.path.join(os.path.dirname(SearchPath.get()),"Results.txt")) 
      OutputPath.set(result_filename) 
      log = os.path.abspath(os.path.join(os.path.dirname(SearchPath.get()),"FoundInvoices.txt")) 

      # For each line in file 
      #TODO: make this for each po_line 
      for PONum in po_number: 
       print("looking for " + PONum) 

       for line in range (0,line_count): 

        #locate Header Record 
        if po_line[line][16:18] == "10" or po_line[line][15:17] == "10": 
         print("On a header record") 

         if PONum in po_line[line].strip(): 
          print("Looking for " + PONum) 
          # Write the current line to the results file 
          with open(result_filename,'a+') as file: 
           file.write(po_line[line] + '\n') 

          # Write this PONum to the log file 
          with open(log,'a+') as logs: 
           logs.write(PONum + '\n') 

          # Loop from the next line to the end 
          with open(result_filename,'a+') as file: 
           for z in range (line+1,line_count): 
            if ((po_line[z][16:18] != "10") and (po_line[z] != '\n') and (po_line[z][15:17] != "10") and (po_line[z][16:18] != "05")): 
             file.write(po_line[z] + '\n') 
            else: 
            # Once we've found a "10" or newline, stop printing this PO 
             break 


    GetCallBack() 







#********************************************************BUTTONS**************************************************************************** 

# Search List Browse Button logic 
BrowseButton = tkinter.Button(text ="Browse", command = GetFile).grid(row=0,column = 2) 

# Search Directory Button logic 
SearchButton = tkinter.Button(text ="Search", command = SearchDir).grid(row=1,column = 2) 

# Find POs Button Logic 
FindButton = tkinter.Button(text ="Get Invoices", command = FindPOs).grid(row=4,column = 1) 


top.mainloop() 
+2

os.walk()を見ましたか? – BHawk

+0

私は、それが吐き出されたファイルを参照しようとしたときに問題がなかったということでした。本質的にそれらはインデックス可能ではなかった。 – Mordecaidrake

+1

必ず 'os.walk()'を使ってください。あなたがそれを働かせることができなかったなら、質問にあなたが試したものの例を含めることができますか? – larsks

答えて

1

あなたはコードが少し複雑すぎます。おそらく、これは全体のコードのほんの一部です。たとえば、GetFileLineCount()は2つの変数を返しますが、そのうちの1つはコードで使用されません。 GetFileNames()は同じ結果を生成できます。

def GetFileNames(): 
    files = os.listdir(SearchPath.get()) #gets list of files 
    file_count = len(fnmatch.filter(files),'*.*')) 
    return files, file_count #can be indexed 

いっそあなたがos.walk()関数でGetFileNamesを置き換えることができます:

def GetFileNames(): 
    filepaths = [] 
    for root,dir,files in os.walk(SearchPath.get()): 
     if len(files) > 0: 
      for file in files: 
       filepaths.append(os.path.join(root,file)) 
    return filepaths 

これはあなたのSearchPathの内のすべてのファイルのリストが表示されます。その上

for filename in filepaths: 
     print("Searching " + filename) 

     with open(filename,'r') as content_file: 
      line_count = sum(1 for line in content_file) 

...と:その後、同じループを使用しますが、あなたのファイル名で、それぞれの時間をあなたのSearchPathのに参加することはできません。

- あなたのコードをすべて書き直したわけではありません。この作業を行うためには、ここでいくつかの変更を加える必要がありますが、これは問題の解決策を提供するはずです。

+0

それはコードの全体です、私は非常にPythonの新しいです。これは何百ものファイルを掘り起こす必要があることに対応していましたが、単一のフォルダ構造ではうまく機能しましたが、サブディレクトリでも機能するように再作成する必要があると考えました。助けてくれてありがとう! – Mordecaidrake

+0

問題はありません。喜んで助けてください。 StackOverflowへようこそ。 – BHawk

関連する問題