私はいくつかの点で、現在のページの言語を決定する必要がありChromeの拡張機能を構築しています。それを行うために、私の計画は、ページのテキストコンテンツ(または少なくともその一部)を抽出し、それを翻訳APIに渡すことです。しかし、私はちょうど、ドキュメントのすべてのtextNode
Sを取得する任意の海峡進むべき道を見つけることができませんでした。文書全体のテキストコンテンツを取得する方法は?
あり、十分なテキストコンテンツがあるまで再帰的に$('body').contents()
を分析することであるバックアップ計画があるが、それは少しサクサク感じ。おそらくもっと良い方法がありますか?
注:Chromeの拡張機能のAPI、それはそれの一部であったかのように、あなたのスクリプトは、ユーザーのページのDOMにアクセスすることができます。
あなたはクローム拡張機能の開発にPythonの実行ファイルを使用することができます方法はありますか?もしそうなら、 'sgmllib'モジュールの' SGMLParser'を使って実現することができます!ないJS –
ページの完全なHTMLで何をしますかを使用してこれを行う方法は非常に確認してください? – kobe