特定の文字列のインスタンスに対してnグラム(約100万行)の大きな外部ファイルを検索しています。その文字列が現れるファイルから行全体を返すことができます。それが可能なのかどうか、またどのようになるのかも知りません。 はここで、現時点では私のコードです:このコードでNode.jsのfs.readFile()を使用して、文字列が表示される行を返します。
composeLines = function(importantWords, cb) {
var word = importantWords.shift();
fs.readFile("./w5_.txt", function(err, cont) {
if (err) throw err;
console.log("String"+(cont.indexOf(word)>-1 ? " " : " not ")+"found");
cb(importantWords);
});
};
私はファイルw5_.txt
は素晴らしいですが、私はそれが関係するnグラムを得ることができるようにする必要があるいくつかの文字列が含まれているかどうかを判断することができますよ。例えば。 「デザイン」を検索すると、「デザインの一部」というnグラムがファイルから返されます。
これについてのお手伝いがあれば幸いです。
感謝場合! – papahummle