文字列比較がR言語で遅すぎる。 3分かかりますが、遅すぎます。文字列が長い場合は時間がかかります。文字列を高速比較する方法はありますか?ありがとう!
date()
strArray1<-rep("1234567890",10000)
strArray2<-rep("1234567890",10000)
tt<-0
for(xx in 1:10000)
{
for(yy in 1:10000)
{
if(strArray1[xx]==strArray2[yy])
{
tt<-tt+1
}
}
}
date()
UPDATE:
a.txt (>10000 lines):
abc00001
abc00035
abc15747
....
B.TXT(> 50000行):
を 実際には次のように、私は、2つのファイルを持っているA.TXTを言うとB.TXTabc00001 blablabla...
abc00002 blablabla...
abc00003 blablabla...
abc00004 blablabla...
....
abc60000 blablabla...
私がしたいのは、b.txtから行を抽出することです。 a.txtのIDを含む行が抽出されます。これは数千の文字列を比較し、長い時間がかかります。それ自体
これはコメントですか、質問ですか?私はRを見たことがありませんが、見た目からは10000x10000倍の文字列(100,000,000回の比較)を比較しようとしています。それはほとんどのプログラミング言語では「遅い」でしょう。 – Neil
あなたのネストされたforループはこれを行うことができるすべての言語で遅くなります –
私はあなたに同意しないでしょう。 CまたはPerlを使用する場合は、おそらく1分未満を使用します。私はCを使って1億個以上の文字列を処理していましたが、非常に高速でした。 – EmanLee