2012-02-29 35 views
1

私は、Pythonを使用しているシステムのすべてのインターネット履歴情報を表示します。 index.datファイルには、ユーザーのすべての履歴情報が格納されていますが、エンコードされています。どのように私はそれをデコードすることができますか?Pythonでインターネット履歴情報を取得して表示するにはどうすればよいですか?

[IはWinInetの方法INTERNET_CACHE_ENTRY_INFOについて聞いてきました。これは、カウントを打つ、訪問したウェブサイトについての情報を提供し、等]

これを達成するためのPythonで利用可能な任意のライブラリはありますか?そうでない場合は、選択肢がありますか?

+3

ブラウザあなたが話しているの? – Kimvais

+2

あなたの質問を編集して、Internet Explorerのみを気にするか、ブラウザの使い方を知りたいと指定してください。誰もInternet Explorerを使用していません。実際、インターネットユーザーの大部分はInternet Explorerを使用していません。 – ninjagecko

+0

私はこれをすべてのブラウザーブラウジングの履歴にしたいと思っています...私はIEのためにこれをインデックスファイルを読んで行いました。しかし、私は、索引のdatファイル – Cholavendhan

答えて

2

コードのみ索引のdatファイル(IEの歴史のみ)からURLを取得する

import sys,os 
from string import * 
from binascii import * 
from chardet import * 
import re 
arr=[] 
ar=[] 
st="" 
url="" 
lines=[] 

def removenonascii(s): 

    l="" 
    for i in s: 
     if(ord(i)==46 or ord(i)==47 or ord(i)==72 or ord(i) in range(97,97+26) or ord(i) in range(65,65+26)): 
     l=l+i 
    lines=l.split('\n') 


    for line in lines: 
     if line.startswith("http"): 
      print line.split("URL")[0] 

infile =open("C:\Users\Cho\AppData\Local\Microsoft\Windows\History\History.IE5\MSHist012012030720120308\index.dat","r") 
for line in infile: 
    arr=line.split("Cho") 

for s in arr: 
    removenonascii(s) 
    print s 
+0

を試してみてくださいVIL。依存関係には何も問題はありませんが、これを指摘すると役立ちます。 –

+0

これらの輸入品は何をしていますか? 'string'は古くから使われておらず、ビルトインの関数やメソッドではないものへの呼び出しは一度もありません。 'chardet'と' binascii'はかなり無関係です。 – alexis

1

あなたがFirefoxの歴史のためにこれをやってみたかった場合、それはユーザーのFirefoxのプロファイル内のファイルplaces.sqliteでSQLiteデータベースです。これは、Pythonのsqlite3ライブラリで開くことができます。あなたがindex.datのあなたの言及によって示唆されているようにあなたがエクスプローラだけを気にするならば、よく私はそれについて知らない。

+0

からのみURLを取得することができ、私は私がインデックスファイルを読み出すことにより、IEのためにこれをやった...すべてのブラウザの閲覧履歴のためにこれを行うことができたいです。しかし、私はindex.datファイルからURLだけを取得することができました。 – Cholavendhan

+0

ありがとう..それはすべてのbroswerの違いは何ですか? THERは、任意の一般的な場所であるか、システムのすべての参照情報を保持するレジスタ... – Cholavendhan

+0

@Cholaは、インターネットの歴史のない中央のレジストリはありません。すべてのブラウザは、独自の方法で履歴を追跡することができます。 Chrome、Opera、Safariの履歴を調べる場合は、別途調査する必要があります。アレクシスのおかげで@ – alexis

関連する問題