0
パーサーnpm HTML-TO-TEXT
を使用して、特定のディレクトリからテキストを抽出しようとしています。私はテキストを取得することができますが、シェルを使用して私はそれを得ることができません。ここ は、私は、このシェルスクリプトを修正するためにいくつかのいずれかを助けることができるnpmパーサー "html-to-text"がシェルスクリプトで動作しない
#!/bin/sh
for i in `ls -a *.html`
do
s=$i
fname=${s##*/}
me=${fname%.*}
text=$me+".txt"
cat $i |html-to-text $i >$text
sed -i.bak '/[*]/ !d' $text
sed -i.bak -e 's/*//g' $text
done
を書いた私のシェルスクリプトです。
これは私にとって多くのコードのように聞こえる。ここに根底にあるアイデアは何ですか?私はコマンドの半分を削除できると確信しています – fedorqui
なぜあなたは 'cat $ i | html2txt $ i> $ text'となります。確かに同じファイルを2回渡しています。 'cat'は通常必要ありません。 'html2text" $ i ">" $ text "'を試してください(まれな場合を除いて、var名をdbl-quoteするのが良い方法です)。がんばろう。 – shellter
そしてS.O. 'f in * .htmlのために説明します。 doは十分であるはずです。がんばろう。 – shellter