現在、2つのExcelファイルの内容を比較するスクリプトを作成しようとしています。Pythonがスプレッドシートを比較する
リスト1のフォーマットは次のとおりです。
Broadcom Drivers and Management Applications [version 17.0.8.2]
QLogic Drivers and Management Applications [version 18.00.8.3]
NVIDIA 3D Vision Driver 306.97 [version 306.97]
Citrix online plug-in (Web) [version 12.1.0.30]
Citrix online plug-in (HDX) [version 12.1.0.30]
Google Update Helper [version 1.3.32.7]
QfinitiPatches_20131211_Win7 [version 1.0.0.0]
Citrix online plug-in (Web) [version 12.1.0.30]
Citrix online plug-in (HDX) [version 12.1.0.30]
Citrix Receiver (HDX Flash Redirection) [version 14.3.1.1]
Citrix Authentication Manager [version 7.0.0.8243]
Microsoft Office Access MUI (English) 2010 [version 14.0.6029.1000]
Microsoft Office Excel MUI (English) 2010 [version 14.0.6029.1000]
Microsoft Office PowerPoint MUI (English) 2010 [version 14.0.6029.1000]
Microsoft Office Publisher MUI (English) 2010 [version 14.0.6029.1000]
リスト2は、次の形式を持っています。私は、スクリプトを実行する必要がどのような
Mcrosoft Word (All versions)
Microsoft Excel (All versions)
Microsoft Access (All versions)
Microsoft Project (All versions)
Microsoft PowerPoint (All versions)
Microsoft Infopath (All versions)
Microsoft Visio (All versions)
Microsoft SQL Server (All versions)
Microsoft SQL Client (All versions)
Microsoft explorer (version 6+)
Firefox (version 2+)
Oracle Database (All versions)
二つのリストは、私はそれが選択されますことを確認する必要があり、正確に一致していないので、参考にリスト2を使用すると、リスト1のいずれかのマッチングのコンテンツを探すことです部分一致と一致する。
リスト2はのMicrosoft Access(すべてのバージョン)を持っており、私はこれを選択するためのスクリプトを必要とするのに対し、例えば、リスト1にのMicrosoft Office AccessのMUI(英語)2010 [バージョン14.0.6029.1000]があります一致として出力し、出力ファイルからこれを省略します。
は、これまでのところ私は
import pandas as pd
import numpy as np
df1 = pd.read_excel('/xls comparison project/xl files/Approved Software list.xls', 'Approved Software', parse_cols = 'd', index=False)
df2 = pd.read_excel('/xls comparison project/xl files/Software list.xlsx', 'Sheet1', parse_cols = 'a')
import csv
AS = df1["Software Title"].tolist()
S = df2["Software"].tolist()
次私は、以下試してみましたが、正確な私はASおよびSと呼ばれる変数に両方のスプレッドシートの内容をロードしている
result = [ x for x in AS if x in S]
に一致するため、これは見えましたリスト形式。その後、
results = result
resultfile = open("output1.xls",'wb')
wr = csv.writer(resultfile, delimiter=',')
for val in result:
wr.writerow([val])
resultfile.close()
これは私が必要とする出力ファイルを与える
私が持っている唯一の問題は、実際に私はアイデアが不足しているデータを、比較しています。
私は広範囲にグーグルで行きましたが、同様の問題を見つけることはできますが、私はそのコンテンツからソリューションを作成することができませんでした。私はかなりPythonに新しいので、私はあなたが私を与えることができる任意のヘルプに感謝します。
感謝
リー