1
ユーザーは、スクリーンスクレイプを使用してExcelスプレッドシートを作成するパイプ区切りテキストファイルを受け取るため、データが混乱します。それは全体を通してランダムな^M (carriage returns)
と<96> (windows en dash)
でいっぱいで、インポートが不完全になります。saskにインポートする前にstray^Mと<96>をテキストファイルから削除するには
私はdos2unix
を試しましたが、変換に問題があるというエラーが表示されます。私は、このサイトで見つけたこのソリューションを使用して、すべての^M
を削除:
tr -d '\r' <infile> outfile
<96>
文字が残っています。これらのダッシュに対応する'/r'
は何ですか?それとももっと良い解決策がありますか?私は実際には、「悪い」ダッシュをできるだけ「良い」ダッシュに置き換えたいと考えています。
テキストファイルのサンプルと出力を共有できますか? –