2011-12-27 12 views
0

テキストが多い.txt(Mac OS X Snow Leopard)ファイルがあります。段落の終わりには、次の段落を別の行に移動するためのハードリターンがあります。これは私のDBにコンテンツを取得するために何をしたいのですかいくつかの問題を引き起こしていますので、とにかく私はハードリターンを削除することができますか?実行できるスクリプトがありますか?私は本当に私が通過して手動でハードリターンを取る必要はありません望んでいる。.txtファイルのすべてのハード(キャリッジ)リターンを削除するために実行できるスクリプトはありますか?

This is some text. Text is what this is. 
And then this is the next paragraph that is on a different line. 

そして、これは私が取得したいものです::ここでは、要約すると

は、それが今のように見えるものである私の.txtファイル内のすべての数千行のために

This is some text. Text is what this is. And then this is the next paragraph that is on a different line. 

ありがとうございます!

EDIT:

私はtxtファイルに取り扱っておりますテキストが実際にHTMLである:

<a href="/link/link/1"> <span class="text">1 </span> THis is where my text is</a><br/> 

そして、後述のように、私はターミナルでcatコマンドを実行すると、最初はそこにあります。他のすべてがありません...

+0

最初のファイルでしか動作しません! –

答えて

1

通常、正規表現のサポートが良好なエディタを使用します。 TextWranglerは素晴らしいです。 TextWranglerの中の行の

エンドはこれだけ\rを検索し、スペースで置き換え、それを削除するには、\rです。 TBH、私はいつもCRLFでエンコードされたファイルをどのように処理するのか疑問に思っていましたが、なんとか動作します。

+0

ありがとうMonolo、このシナリオで動作する正規表現と共有してもよろしいですか?ありがとう! – Lizza

1

私はあなたがAppleScriptでこれを行うことができると信じています。残念ながら、私はそれに精通していませんが、次のことはあなたがこれを達成するのに役立つはずです(別の問題ですが、あなたが必要とする方向にあなたを導くでしょう):http://macscripter.net/viewtopic.php?id=18762

また、 AppleScriptをでこれを行うとExcelがインストール(またはそれを持つマシンへのアクセス)は、次は役立つはず:http://www.mrexcel.com/forum/showthread.php?t=474054

2

ターミナルで:

cat myfile.txt | tr -d '\r' > file2.txt 

これを行うには、より効率的な方法は、おそらくあります、ので、 "tr -d '\ r'"は有効成分ですが、それがアイデアです。

+0

お返事ありがとうございました。私はそれを試してみて、それは 'tr:Illegal byte sequence'と言っています。何か案は? – Lizza

+0

trのUnicodeサポートが不足していると思います。つまり、その意味では存在しません。 'sed"/\ r/d "myfile.txt> file2.txt'を試してみてください。そうであれば、確かに勝者がありますが、sedがユニコードをサポートしているかどうかはわかりません。 – Campadrenalin

+0

ええと、それは新しいファイルを作りますが、それには何もありません... – Lizza

1

Linux端末ではcat file.txt | tr -d "\r\n" | > new file.txtとなります。 \r\nの部分を変更して、希望するチャーターを削除してください。

+0

あなたの答えをありがとう。私は私のtxtファイルのHTMLを扱っていることを明確にすべきであった。あなたのコマンドは最初の Lizza

関連する問題