2016-10-18 1 views
0

私は2つのcsvファイル(同様の形式)は、一つのファイルに重複して出力ユニークなコンテンツを排除し、同様の列を含む2つのCSVファイルを比較

file1.csv

post_status post_type post_content post_title 
publish  post  paragraph one title one 
publish  post  paragraph two title two 
publish  post  paragraph three title three 
publish  post  paragraph four title four 

file2.csv

post_status post_type post_content post_title 
publish  post  paragraph one title one 
publish  post  paragraph two title two 
publish  post  paragraph three title three 
publish  post  paragraph four title four 
publish  post  paragraph five title five 
publish  post  paragraph six title six 
を持っています

希望-output.csv

post_status post_type post_content post_title 
publish  post  paragraph five title five 
publish  post  paragraph six title six 
私がこれまでに得ている社の

ソリューションは、パワーシェルおよびこれを使用している:

cat first.csv second.csv | sort -u >result.csv 

これは、元のファイルの一貫性を維持しない結果を生成します。

私はUbuntuとWindowsを使用しています。シンプルで洗練されたソリューションを探しています。任意のすべてのヘルプは高く評価されます。

+0

@whateverありがとうございます。どのプラットフォームでこれを試してみますか? WindowsのcmdまたはUbuntuの端末? –

答えて

0

このソリューションは、実際には、あなたが1行ですべてを行うことができますWindows PowerShellの

です

$Content = Get-Content first.csv,second.csv 
$Content | Select-Object -Unique | Out-File result.csv 

をお試しください:

Get-Content first.csv,second.csv | Select-Object -Unique | Out-File result.csv 

から以外にご使用のバージョンと私(の唯一の違いPowerShell cmdsのlinuxエイリアスを使用している)は、あなたがエントリの順番を変えるSort-Objectを使っていることです:)

関連する問題