2016-04-30 6 views
-1

このスクリプトを使用してカスタムWordlistを構築します。 Wordlist Scriptこのスクリプトを自分のニーズに合わせて編集する

このスクリプトは、低アルファ文字のみを含む単語リストを作成します。しかし、私は下/上の文字と数字が欲しいです。 出力は、この例のようにする必要があります:私はそれを変更する方法を知らない

test 
123test 
test123 
Test 
123Test 
Test123 

。もしあなたが私を助けてくれたら本当に嬉しいです。 私はgrepと正規表現のチュートリアルをいくつか試しましたが、何も分かりません。

+0

あなたは小文字の単語を基本的にcamelCaseに変換しようとしていますか? – sweaver2112

+0

No.このスクリプトは、grepとregexによってフィルタリングされた単語のWebサイトをスクラップします。現在の設定では、大文字の文字は小文字に変換されますが、Webサイトにあるように「元の」単語が必要です。 – JKaiser

+2

あなたの質問に直接スクリプトを含めてください。それが利用できなくなるか、新しいバージョンをコミットするだけで、あなたの質問はもう意味をなさないでしょう。 –

答えて

1

スクリプトの18行目。これにより

page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | tr '[:upper:]' '[:lower:]' | sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' | sort -u`; 

を交換してください:あなたはそれを見ている場合は、それ

  1. がで" "を置き換える方法

    page=`grep '' -R "./temp/" | sed -e :a -e 's/<[^>]*>//g;/</N;//ba' | tr " " "\n" | sort -u`; 
    

    、あなたが見ることができます"\n"

  2. 変更のケース長さ
  3. フィルタ
  4. 種類

あなたはそのパイプ・チェーンからビットを削除し、出力はスクリプトからこのビットを削除

0

をどのように変化するかを見ることができます:

ます
tr '[:upper:]' '[:lower:]' | 

ケースだけを残す。

のみ削除するか、別の範囲を好む場合は変更される可能性が9〜25文字から単語を選択しwordlist.shのビットもあります:

`sed -e '/[^a-zA-Z]/d' -e '/^.\{9,25\}$/!d' |` 

か、シンプルな戦略を試みることができる:ダウンロードとはw3mの、コマンドライン、Webブラウザをインストールし、これとwordlist.shで複雑なラインを置き換える:

page=`grep '' -R "./temp/" | w3m -dump wikipedia.org | grep -o '\w\+' | sort -u` 

grepはその後、htmlファイルからすべてのテキストを取得する(奇妙な)方法ですw3m -dumpはすべてのhtmlタグとその他の非表示のものを取り除き、grep -o '\w\+'はすべての単語に一致します。

関連する問題