2009-08-14 8 views
0

FacebookやDiggで何かを共有すると、ページの要約が生成されます。私はPerlでこれをどのようにしますか?どんなアルゴリズムがありますか?例えばPerlでウェブサイトの要約を作成するにはどうすればよいですか?

:私はフェイスブックに移動し、リンクとして、この質問を共有しようとした場合

How can I create a website summary with Perl?

それは「Facebookの/ Diggがウェブサイトの要約を取得する - スタックオーバーフロー?」取得タイトルとして(

+2

は、あなたがより詳細に探している要約の種類を説明できますか? – Mark

答えて

1

は、基本的には、まず<のdiv >または<P> elemはあるかもしれない「最も重要な段落の」URLをこすりして検索したいだけのページのタイトル)とである[...不完全な疑問?]最初の<h2>または<h1>の後に、ページのレイアウトによって異なります。

1

あなたは、ページ上にメタ記述があるかどうかをチェックして見ることができますが、メタ記述を書いた人の慈悲のままになります。

+0

私はこれをやろうとしましたが、記事のほとんどはそれらを含んでいません。 – Timmy

2

通常要約はURLを送信し、ユーザによって書かれている...あなたは、リンクを共有する意味

を仮定。

しばしば空の説明やキーワード(のようなメタデータを使用して文書本体(それ自体は簡単ではありません)
  • の最初の100かそこらの文字を使用して
    • :あなたは要約を記述する必要があります場合は自動的にこれをすることによって達成することができますrecreating Google snippets様またはスパム)
    • コンテキスト関連の要約(ごめんそのPHPはなく、単純な)Yahoo Keyword Extractor APIしたり、独自のキーワード密度関数
    のようなものを使用して文書から
  • タグ/キーワード

    あなたの最良の賭けは、ユーザーに尋ねることです!

    多少お役に立てば幸いです:)

  • 関連する問題