2017-02-22 11 views
-2

フラスコのjsonオブジェクトとしてhtmlファイルを解析したいと思います。拡張子htmlのファイルをインポートする場所があるとしましょう。出力は次のようになります。Pythonフラスコhtmlのjsonへの解析

{ 
    "a":[ 
     "https://www.google.hu/", 
     "https://www.facebook.com/" 
    ] 
} 

誰かがこれに関するガイドやアドバイス、助言を分かち合うことができますか?読んでくれてありがとう。

答えて

0

ここに複数の問題があるようです。私はJSONの質問に答えてみましょう。フラスコライブラリからjsonをインポートし、json.dumps()メソッドを使用して、辞書オブジェクトをレスポンスで返すのに適したJSON文字列にエンコードする必要があります。以下のサンプルコードを確認してください。

from flask import Flask, json 

app = Flask('0.0.0.0', port=8080, debug=True) 

@app.route('/url', methods=['POST']) 
def html_json(): 
    data = {"a": ["https://www.google.hu/", 
        "https://www.facebook.com/" 
       ] 
    } 
    return json.dumps(data), 200 

http://flask.pocoo.org/docs/0.12/patterns/fileuploads/は、ファイルのアップロード作業に役立ちます。

美しいスープ

BeautifulSoupは、HTMLを解析するために使用することができますPythonのライブラリです。これは、繰り返し処理してJSONに変換できる、構造化された要素セットを提供します。

from BeautifulSoup import BeautifulSoup 
html = "html file as string here" 
soup = BeautifulSoup(html) 

HTMLの各タグを繰り返し処理できます。ここで

links = soup.find_all('a',href=True) 

は誰かがJSON(ページ全体よりもはるかに簡単)にHTMLテーブルに変換質問です:Convert a HTML Table to JSON

私は助けることができるブログの記事を見つけました。作者はJSON ParserへのHTMLを作成しました:http://www.xavierdupre.fr/blog/2013-10-27_nojs.html

+0

はいこれ以上のものはありません。そして、私は今立ち往生しています。 )。分かち合いありがとうございました。 –

+0

私が手助けした場合、あなたが立ち往生している場合、私があなたを助けることができるように、あなたが何をしているのかを教えてください。 –

+0

私のポールブはここで私が例として共有したjson形式を使用しています。どのように私はすべてのhtml要素をjsonとして拡張できますか?これは、がJSONオブジェクトテキストのようになり、タグの内部のすべてが要素として表示されるようなものです。 –