ID列と20個程度の変数からなる2つのタブ区切りファイルがあります。両方のファイルに存在するIDを探したいと思います。私が求めているのは、bashスクリプト「diff」の反対のようなものです。アドバイスをいただければ幸いです。ファイル間の類似点を探すためのシェルスクリプト
0
A
答えて
1
ソートファイル、あなたは
$ join sortedfile1.txt sortedfile2.txt
を使用することができますし、共通のIDラインが参加されます。
2
ツールcomm
は、2つのファイルからソートされた入力を指定することができます。どちらの行がファイルAにのみ存在するか、両方ともにあり、ファイルBにのみあることがわかります。たとえば、
17 p o i u
13 a b c d
14 q w e r t
...とあるfile-b
:
18 a s d f
13 f g h i
7 z x c v
あなたは次のようにプロセス置換とcomm
を使用することができます。
file-a
を持っています10
$ comm -1 -2 <(cut -d ' ' -f 1 file-a|sort) <(cut -d ' ' -f 1 file-b|sort)
13
パラメータ-1
は、最初のファイルのみの行を抑制し、-2
は、2番目のファイルのみを抑制します。
0
cut -f1 file1 file2 | sort | uniq -d
関連する問題
- 1. データストアとの類似点を探す
- 2. 類似の名前のファイルを探す
- 3. 類似のアイテムを探す
- 4. リポジトリから類似ファイルを探す
- 5. 文の間の類似点の計算
- 6. 最も類似したドキュメントを探す
- 7. pythonでJaccardの類似点
- 8. ロケーションのSOLRカスタム類似点
- 9. WordNetの類似点java
- 10. LuceneのJaccard類似点
- 11. DockerHubとGitHubの類似点
- 12. 2点間の中間点を探す
- 13. ユークリッド距離と類似点
- 14. テキストファイル間の類似点を分析するために使用できる「ビッグデータ」アルゴリズムとは何ですか?
- 15. C++:構造と配列の類似点
- 16. Doc2Vec Gensimドキュメントとトピックの類似点
- 17. ASP.NETコアとNode.jsの類似点
- 18. Pythonグループの類似したファイル名
- 19. PHPでRSSフィードの "類似の"記事を探す
- 20. Androidファイル:///類似のパス
- 21. PHP(または類似のもの)を介したファイル作成時間
- 22. NSArrayで類似の文字列を探します
- 23. 類似の単語を探しています
- 24. mdbファイルとMySQLサーバースキーマの類似テーブル間のデータの同期化
- 25. クラスタリングのためにRの距離(非類似性)または類似点を使用する必要がありますか?
- 26. IBM Watson:構造ファイル間で類似のパターンを検索
- 27. 画像の類似度を考慮しない画像類似度ライブラリを探す
- 28. laravel elixir類似のファイルをマッピングする
- 29. 類似のExcelファイル間を移動するためにTableauでテンプレートを作成する
- 30. 計算コサイン類似点spark java