2016-04-06 8 views
0

私は、イベントのリストを生成するためにアルゴリズムを使用しました。各イベントは日付(YYYY、MM、DD)で表されます。アルゴリズムの精度を検証するために、生成されたイベントのリストを手動で検証されたイベントのリストと比較する必要があります。私はこれを行うためにExcelを使用したいと考えています。手動で確認されたイベントの一覧は次のとおりです。彼らはランダムな順序です。Excelを使用して長い日付のリスト内の特定の日付を見つける

2003 8 11 
2012 11 19 
2005 6 17 
2007 8 26 
2002 8 6 
1999 10 11 
2001 2 10 
2012 9 16 
1998 9 17 
1997 9 21 
2012 9 30 
2002 9 21 
2014 6 2 
2002 7 21 
2012 11 18 
2008 11 7 
2007 10 3 
2002 5 24 
1998 7 18 
2003 3 28 
2005 9 29 
2012 8 19 
2011 1 29 
2009 12 24 
1998 9 26 
2011 1 25 
2010 3 26 
2007 5 31 
2010 1 28 
2003 9 23 
2009 2 21 
2010 8 14 
2000 1 29 
2001 7 13 
2006 7 10 
2004 5 21 
1999 5 29 
2002 6 15 
2007 10 4 
2008 8 21 
2000 9 6 
2002 1 8 
2005 10 14 
1998 2 17 
2008 12 10 
2004 10 19 
2005 3 5 
2010 8 19 
1997 8 18 
2006 7 12 
2008 3 27 
1999 3 5 
2001 10 6 
2012 9 4 
2009 6 14 
2000 8 19 
2002 10 29 
2014 4 17 
2001 11 17 
1998 10 3 
2009 2 15 
2004 5 3 
2014 3 16 
2012 4 21 
2009 2 24 
2002 7 1 
2002 8 1 
2010 2 13 
2004 9 16 
2013 10 6 
1999 4 19 
2009 1 30 
2005 5 16 
1999 3 4 
2012 9 13 
2006 4 12 
2013 9 15 
2001 11 2 
2011 1 3 
2004 12 23 
2001 11 16 
2010 7 17 
2004 2 21 
2011 12 26 
2013 8 30 
2005 1 16 
2008 8 3 
2007 10 13 
2004 8 27 
2003 10 17 
2001 4 20 
2003 11 6 
1998 12 26 
2008 9 22 
1997 11 12 
2006 7 5 
2014 4 5 
2014 4 24 
1998 8 20 
2010 10 27 
2006 7 30 
1998 3 17 
2008 12 31 
2014 4 19 
2003 3 22 
2008 10 3 
2007 9 28 
2010 4 3 
2006 11 17 
2014 1 3 
2012 7 26 
2005 3 24 
1999 8 20 
2010 10 21 
2009 4 16 

私のアルゴリズムによって生成されるイベントは、同じ形式(年、月、日)であり、約3000のイベントがあります。以下のサンプルデータ。

2000 3 23 
2000 3 28 
2000 3 31 
2000 4 1 
2000 4 2 
2000 4 3 
2000 4 4 
2000 4 12 
2000 4 18 
2000 5 1 
2000 5 4 
2000 5 5 
2000 5 24 
2000 6 20 
2000 7 25 
2000 8 7 
2000 8 20 
2000 8 22 
2000 8 26 
2000 8 27 
2000 8 28 
2000 8 29 
2000 8 30 
2000 9 1 
2000 9 3 
2000 9 4 
2000 9 5 
2000 9 6 
2000 9 7 
2000 9 15 
2000 9 20 
2000 9 21 
2000 9 24 
2000 9 25 
2000 9 29 
2000 9 30 
2000 10 2 
2000 10 4 
2000 10 5 
2000 10 10 
2000 10 11 
2000 10 12 
2000 10 14 
2000 10 17 
2000 10 18 
2000 10 19 
2000 10 21 
2000 10 22 
2000 10 23 

私のアルゴリズムが正確だった場合、表示されるデータの最初のセットは2番目のデータセットのサブセットである必要があります。大規模なデータセットの中で、それぞれの精神的に検証された日付の出現を効率的に検索するためにExcelを使用する方法はありますか?もしそうなら、Excelはトップデータセットのどの日が2番目のデータセットに含まれているか教えてくれますか?あなたのデータが列に、列A、B、およびCであると仮定すると、あなたが提供されたデータ、およびIは、上記の作ったコメントでの式で

+0

Dは '= DATE(A2、B2、C2)'を使用して、通常のExcel日付値を作成します。両方のデータセットでこれを行います。次に、データのサブセットについて、 '= IF(ISERROR(VLOOKUP(D2、origdataSht!$ D $ 2:$ D $ 2000,1))、 'Not Found'、 'Found')'あなたの元のデータとシートの。編集:あなたのデータが順序でない場合、ルックアップは 'VLOOKUP(D2、origdataSht!$ D $ 2:$ D $ 2000,1、FALSE)'でなければなりません。 – OldUgly

答えて

1

...

original data looking at new data

new data looking at original data

+0

こんにちはOldUgly、お返事ありがとうございます。私は説明したように実装しようとしました。私はしかし、いくつかの質問があります。日付を作成するとき、あなたの年は2桁(例えば07年の代わりに07年)で表されます。私は日付機能を試みるときに4桁の数字を返します(たとえば2007年)。あなたが示唆したように、これはコードを混乱させるでしょうか? –

+0

また、私はコードを実装するとほぼ完全に "見つかった"が、手動でチェックしたところ、最初のデータセットにその日付が実際には存在しなかった場所が見つかったという例が多くありました。あなたの公式では、$ D $ 2000という部分のポイントは何ですか? –

+0

vlookupにFalseを指定した場合、あなたのコメントで指摘したように、よりうまく機能しているようです。 –

関連する問題