2011-06-29 4 views
-2

大きなテキストファイルが2つあります(それぞれ約1.8GBがUTF-8でエンコードされています)。そして、両方のファイルの内容が100%同じかどうかを確認したいと思います。単一の文字の違いがある場合、それは同じではないと考えられ、すなわち、両方のファイルが異なる。それ、どうやったら出来るの?2つの大きなテキストファイルの内容が100%同じかどうかを確認するにはどうすればよいですか?

私の質問は:どのように2つの大きなテキストファイルの内容が100%同じかどうかを確認するには?

Dim TextFile1 as String = "C:\TextFile1.log" 
Dim TextFile2 as String = "C:\TextFile2.log" 

UPDATE:私はあなたが自分のサイズを比較することができます初心者のために、特定のPCだけで256メガバイトのメモリ

答えて

1

まあを持っているので、解決策は、最小限のメモリを使用する必要があります追加するのを忘れ

(同じサイズでない場合、同じコンテンツを持つことはできません)。これについてはFileInfo.Lengthのプロパティを見てください。

彼らは同じ大きさを持っている場合は、あなたがcompare them byte by byte

+0

テキストの場合は、文字を比較する必要があります。エンコードを考慮してください。 – Joey

+0

2番目のリンクのコードはファイルサイズの比較を行います。 – Joey

1

することができます私は私は名前が変更された重複したPDFファイルを識別するために必要な同様の問題に遭遇してきました。これを行う最善の方法は、md5ハッシュを使用することでした。 私はすばやいgoogle検索を行い、vb.netにはこれを行うための機能が組み込まれているようです。チェックアウト http://www.vbknowledgebase.com/?Id=88&Desc=Find-Duplicate-files-using-Vb.Net-using-MD5-Hash

+0

2つのファイルだけを比較する場合、チェックサムを計算することは直接比較に比べて全く利点がありません。 –

関連する問題