つぶやきのための小さな検索エンジンを作成したいと思います。私は20000つぶやきのtxtファイルを持っています。最初の行はusername
あるLuceneでのtxtファイルのインデックス作成
TommyFrench1
851
85170333395811123
Lurgan, Moira, Armagh. Derry
This week we are double delight on first goalscorers on the four Champions League matches in shop. ChampionsLeagueIm_Aarkay
175
851703414300037122
Paris
@ChampionsLeague @AS_Monaco @AS_Monaco_EN Nopes, it's when City knocked outta Champions league. .
.
etc
第二に、私は次のid
とlocation
で、最後はtext(tweet)
で、followers
を持っている、:のようなファイル形式があります。
すべてのツイートはドキュメントだと思います。だから私は20000文書を持っている必要があり、すべての文書は5つのフィールド(ユーザー名、フォロワー、IDなど)が必要です。
どのようにインデックスを作成できますか?
は、私はいくつかのチュートリアルを見てきましたが、私は
EDIT似た何かを見つけませんでした。ここに私のコードです。 Index cannot be resolved or is not a field
:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.io.IOException;
import java.nio.file.Paths;
import java.text.ParseException;
import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StringField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopScoreDocCollector;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
public class MyProgram {
public static void main(String[] args) throws IOException, ParseException {
FileReader fileReader = new FileReader(new File("myfile.txt"));
BufferedReader br = new BufferedReader(fileReader);
String line = null;
String indexPath = "C:\\Desktop\\myfolder";
Directory dir = FSDirectory.open(Paths.get(indexPath));
Analyzer analyzer = new StandardAnalyzer();
IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
IndexWriter writer = new IndexWriter(dir, iwc);
while ((line = br.readLine()) != null) {
// reading lines until the end of the file
Document doc = new Document();
String username = br.readLine();
doc.add(new Field("username", username, Field.Store.YES, Field.Index.ANALYZED)); // adding title field
String followers = br.readLine();
doc.add(new Field("followers", followers, Field.Store.YES, Field.Index.ANALYZED));
String id = br.readLine();
doc.add(new Field("id", id, Field.Store.YES, Field.Index.ANALYZED));
String location = br.readLine();
doc.add(new Field("location", location, Field.Store.YES, Field.Index.ANALYZED));
String text = br.readLine();
doc.add(new Field("text", text, Field.Store.YES, Field.Index.ANALYZED));
writer.addDocument(doc); // writing new document to the index
br.readLine();
}
}
}
イムは、次のエラーを取得します。
どうすればこの問題を解決できますか?
あなたが「インデックス」とはどういう意味ですか、あなたはこれを達成するために何をしたいですか - などの
何か? –
私は20000つぶやき用の小さな検索機を作るプロジェクトを持っています。インデックス作成プロセスは、Luceneによって提供されるコア機能の1つです。私はtxtファイルを読む必要があり、すべてのツイートは文書でなければなりません。それから、すべてのドキュメントにはusername、id、locationなどのフィールドが必要です。私はそれがうまくいくかどうか考えていますが、Luceneでは初心者です。このようなものを見つけることができます –
あなたはこの質問を見ましたか?/question/4091441/how-do-i-index-and-search-text-files-in-lucene-3-0-2?rq = 1 –