2013-02-22 8 views
6

Google ChromeとMozilla FirefoxからエクスポートされたブックマークファイルをJavaで解析するにはどうすればいいですか?それらを直接解析してURLを取得できるライブラリがあります。エクスポートされたブックマークのためのパーサーGoogle ChromeとJavaのMozillaのHTMLファイル

また、Javaで解析するためのサンプルコードが最も歓迎されています。

+0

ブックマークは物理ファイルとして保存されています。これらのファイルを解析可能かどうかチェックしましたか? – user1428716

+0

ええ、エクスポートされたファイルはhtmlファイルであり、htmlパーサを使用して解析できますが、私はmozillaとgoogle chromeの両方を解析するための適切な作業方法が必要です。私は誰もがそれ以前にそれをしていたので、彼らはすべてのエラーを可能にしていたので、私にとってより有用になります。 –

+0

私が例を挙げて私のページを見せたら、あなたがパーサーを書くのを助けることができます)パースの主な目的は何ですか? –

答えて

2

新しいコメントが投稿されました。解決策は、これを行うためにJSOUPオープンソースプログラムを使用することです。 JSOUPはあなたがTomcatなどのローカルサーバー上のエクスポートブックマークHTMLをホストし、

http://yourip:<port>/<yourProject>/<bookmark.html>. 

それのDOMを取得したい場合がありますので、唯一のHTTPまたはHTTPSプロトコルを受け入れるJSOUPはかなり自明です。

その他の単純な方法:

ChromeとFirefoxのブックマークは以下のようにJSONとして保存されます。

Javaの方法:JSONを使用してこれらを解析することをお勧めします。以下の構造に基づいて参照Javaオブジェクトを作成します。

または単にUNIXコマンドプロンプトを使用するとChrome APIで行うことが、あなたはまだ興味を持っている場合しかし

grep -i "url" <bookmark file path> | cut -d":" -f2 

を行うには、次にアクセスしてください。ほとんどのケースでhttp://developer.chrome.com/extensions/bookmarks.html

{ 
    "checksum": "702d8e600a3d70beccfc78e82ca7caba", 
    "roots": { 
    "bookmark_bar": { 
    "children": [ { 
     "date_added": "12939920104154671", 
     "id": "3", 
     "name": "Development/Tutorials/Git/git-svn - KDE TechBase", 
     "type": "url", 
     "url": "http://techbase.kde.org/Development/Tutorials/Git/git-svn" 
    }, { 
     "date_added": "12939995405838705", 
     "id": "4", 
     "name": "QJson - Usage", 
     "type": "url", 
     "url": "http://qjson.sourceforge.net/usage.html" 
+0

検索する必要があるのは、javaを使ってhtml解析することです。サンプルブックマークhtmlファイルを取得するには、Webブラウザーで提供されているエクスポートブックマークオプションを使用します。 –

+0

@lijojohn - あなたの要件を満たすために私の答えを編集しています – user1428716

7

を、あなたはしないでください実際にHTMLファイルを解析する必要があります。 ChromeはブックマークをJSONファイルに保存します。 JSONパーサを使用してそのファイルを読み込むほうがずっと簡単です。

あなたは(他のO/Sのための周りのLinux上で、とにかく、グーグル)に位置することに興味があるファイル:

/home/your_name/.config/google-chrome/Default/Bookmarks 

JSONの解析が容易です。 Googleの周りまたはHow to parse JSON in Javaから開始します。

JSONデータを掘り起こす前にJSONデータを視覚化したい場合は、http://chris.photobooks.com/json/default.htmもご覧ください。

+3

ありがとう、それは便利です。 Windows 7の場合は、 'C:\ Users \ your_name \ AppData \ Local \ Google \ Chrome \ User Data \ Default'です。 –

関連する問題