は、一つのファイルに重複して出力ユニークなコンテンツを排除し、同様の列を含む2つのCSVファイルを比較

私は2つのcsvファイル（同様の形式）は、一つのファイルに重複して出力ユニークなコンテンツを排除し、同様の列を含む2つのCSVファイルを比較

file1.csv

post_status post_type post_content post_title 
publish  post  paragraph one title one 
publish  post  paragraph two title two 
publish  post  paragraph three title three 
publish  post  paragraph four title four

file2.csv

post_status post_type post_content post_title 
publish  post  paragraph one title one 
publish  post  paragraph two title two 
publish  post  paragraph three title three 
publish  post  paragraph four title four 
publish  post  paragraph five title five 
publish  post  paragraph six title six

を持っています

希望-output.csv

post_status post_type post_content post_title 
publish  post  paragraph five title five 
publish  post  paragraph six title six

私がこれまでに得ている社の

ソリューションは、パワーシェルおよびこれを使用している：

cat first.csv second.csv | sort -u >result.csv

これは、元のファイルの一貫性を維持しない結果を生成します。

私はUbuntuとWindowsを使用しています。シンプルで洗練されたソリューションを探しています。任意のすべてのヘルプは高く評価されます。

出典

2016-10-18 w-kevin

@whateverありがとうございます。どのプラットフォームでこれを試してみますか？ WindowsのcmdまたはUbuntuの端末？ –

このソリューションは、実際には、あなたが1行ですべてを行うことができますWindows PowerShellの

です

$Content = Get-Content first.csv,second.csv 
$Content | Select-Object -Unique | Out-File result.csv

をお試しください：

Get-Content first.csv,second.csv | Select-Object -Unique | Out-File result.csv

から以外にご使用のバージョンと私（の唯一の違いPowerShell cmdsのlinuxエイリアスを使用している）は、あなたがエントリの順番を変えるSort-Objectを使っていることです:)

出典

2016-10-18 13:48:39 whatever

は、一つのファイルに重複して出力ユニークなコンテンツを排除し、同様の列を含む2つのCSVファイルを比較

答えて

関連する問題