私はPerlのWebページのテキストとテキストの比率を決定する方法を探しています。何も探していない複雑なHTMLコードのような単純なプリントアウト:75%テキスト:25%SEO理由だけ。Perlテキストのコード比率
答えて
うーん...すぐに考えて...についてどのように:
perl SCRIPT file1.html file2.html
注:
my $htmllength = 0;
my $textlength = 0;
while(<>) {
s/(<[^>]*>)/$htmllength += length($1); "";/eg;
$textlength += length($_);
}
print "HTML Code: " . (100 * $htmllength/($htmllength + $textlength)) . "\n";
print "Text : " . (100 * $textlength/($htmllength + $textlength)) . "\n";
あなたは、単に問題のファイル(複数可)上でスクリプトを実行することができ、このデータにCDATAフィールドが含まれている場合は機能しません。
[正規表現で\ [X \] HTMLを解析することはできません](http://stackoverflow.com/a/1732454/119280)! – DVK
いいえ、でも私はそれを解析していません。しかし、私はプレゼンテーションに目に見えない可能性のあるコンテンツを通しています。 –
すべての否定的な投票ありがとう!私に失敗したファイルを表示して、その投稿を削除します!ランダムな推測で –
HTML :: TreeBuilderを使用してテキストを取り除きます。
#!/usr/bin/perl
use strict;
use warnings;
use v5.10;
use LWP::Simple;
use HTML::TreeBuilder;
my $content = get(shift @ARGV);
die "Couldn't get it!" unless defined $content;
my $text = HTML::TreeBuilder->new_from_content($content)->as_text;
my $html_size = length $content;
my $text_size = length $text;
my $percentage = 100 * ($text_size/$html_size);
say qq[$percentage%];
- 1. テキスト解析のコード効率
- 2. C-効率的なコードと良いコードとの比較
- 3. ファイルの内容を比較するためのperlコード
- 4. JPanelレイアウトの問題:比率/スペースの比率で
- 5. perlの%2Bの比較
- 6. Perlテキストの抽出
- 7. Android画面比率
- 8. QAからdevの比率
- 9. Photoswipeの画像サイズ/比率
- 10. R ggsurvplotの固定比率
- 11. ビューポート比率でのフェードイン/アウト
- 12. PerlへのPythonコード
- 13. テキスト-TとPDFのPerlファイルテスト
- 14. perlのテキスト> xmlコンバータスクリプト
- 15. 比率をパーセントで表示
- 16. 比較>>>効率
- 17. 比率を計算する
- 18. JavaScriptコードの効率
- 19. SAXコード効率
- 20. SASコード効率
- 21. テキスト比較アルゴリズム
- 22. 比較のための水平バープロット2つのデータベースの比率
- 23. Perlコード変更ログ
- 24. イメージファイルのサイズと面積の比率
- 25. プロセッサと反復のPythonマルチプロセッシングの比率
- 26. ビデオのアスペクト比の比率を変更する方法
- 27. Perl/PythonコードへのJava Wrapper
- 28. sendmailのPerl終了コード17920
- 29. 比率のプロットタイプ(色合い付き)
- 30. MPI BMP画像比較の効率化
私は、ファイルとしてWebページを取る変数に配置して、HTMLコードと表示されるテキストである割合である割合を決定したいと思いSEO – Zaid
を明確にしてください。 – Blnukem
HTMLタグはめったに「コード」ではありません。 "マークアップ"という用語を使用するのはどうですか? – mob