2017-04-26 17 views
0

つぶやきのための小さな検索エンジンを作成したいと思います。私は20000つぶやきのtxtファイルを持っています。最初の行はusernameあるLuceneでのtxtファイルのインデックス作成

TommyFrench1
851
85170333395811123
Lurgan, Moira, Armagh. Derry
This week we are double delight on first goalscorers on the four Champions League matches in shop. ChampionsLeague

Im_Aarkay
175
851703414300037122
Paris
@ChampionsLeague @AS_Monaco @AS_Monaco_EN Nopes, it's when City knocked outta Champions league. .
.
etc

第二に、私は次のidlocationで、最後はtext(tweet)で、followersを持っている、:のようなファイル形式があります。

すべてのツイートはドキュメントだと思います。だから私は20000文書を持っている必要があり、すべての文書は5つのフィールド(ユーザー名、フォロワー、IDなど)が必要です。

どのようにインデックスを作成できますか?

は、私はいくつかのチュートリアルを見てきましたが、私は

EDIT似た何かを見つけませんでした。ここに私のコードです。 Index cannot be resolved or is not a field

import java.io.BufferedReader; 
import java.io.File; 
import java.io.FileReader; 
import java.io.IOException; 
import java.nio.file.Paths; 
import java.text.ParseException; 

import org.apache.lucene.analysis.Analyzer; 
import org.apache.lucene.analysis.standard.StandardAnalyzer; 
import org.apache.lucene.document.Document; 
import org.apache.lucene.document.Field; 
import org.apache.lucene.document.StringField; 
import org.apache.lucene.document.TextField; 
import org.apache.lucene.index.DirectoryReader; 
import org.apache.lucene.index.IndexReader; 
import org.apache.lucene.index.IndexWriter; 
import org.apache.lucene.index.IndexWriterConfig; 
import org.apache.lucene.queryparser.classic.QueryParser; 
import org.apache.lucene.search.IndexSearcher; 
import org.apache.lucene.search.Query; 
import org.apache.lucene.search.ScoreDoc; 
import org.apache.lucene.search.TopScoreDocCollector; 
import org.apache.lucene.store.Directory; 
import org.apache.lucene.store.FSDirectory; 
import org.apache.lucene.store.RAMDirectory; 
import org.apache.lucene.util.Version; 

public class MyProgram { 

    public static void main(String[] args) throws IOException, ParseException { 
     FileReader fileReader = new FileReader(new File("myfile.txt")); 
     BufferedReader br = new BufferedReader(fileReader); 
     String line = null; 

     String indexPath = "C:\\Desktop\\myfolder"; 
     Directory dir = FSDirectory.open(Paths.get(indexPath)); 

     Analyzer analyzer = new StandardAnalyzer(); 
     IndexWriterConfig iwc = new IndexWriterConfig(analyzer); 

     IndexWriter writer = new IndexWriter(dir, iwc); 


     while ((line = br.readLine()) != null) { 
      // reading lines until the end of the file 
      Document doc = new Document(); 
      String username = br.readLine(); 
      doc.add(new Field("username", username, Field.Store.YES, Field.Index.ANALYZED)); // adding title field 
      String followers = br.readLine(); 
      doc.add(new Field("followers", followers, Field.Store.YES, Field.Index.ANALYZED)); 
      String id = br.readLine(); 
      doc.add(new Field("id", id, Field.Store.YES, Field.Index.ANALYZED)); 
      String location = br.readLine(); 
      doc.add(new Field("location", location, Field.Store.YES, Field.Index.ANALYZED)); 
      String text = br.readLine(); 
      doc.add(new Field("text", text, Field.Store.YES, Field.Index.ANALYZED)); 
      writer.addDocument(doc); // writing new document to the index 


      br.readLine(); 
     } 

    } 
} 

イムは、次のエラーを取得します。

どうすればこの問題を解決できますか?

+0

あなたが「インデックス」とはどういう意味ですか、あなたはこれを達成するために何をしたいですか - などの

何か? –

+0

私は20000つぶやき用の小さな検索機を作るプロジェクトを持っています。インデックス作成プロセスは、Luceneによって提供されるコア機能の1つです。私はtxtファイルを読む必要があり、すべてのツイートは文書でなければなりません。それから、すべてのドキュメントにはusername、id、locationなどのフィールドが必要です。私はそれがうまくいくかどうか考えていますが、Luceneでは初心者です。このようなものを見つけることができます –

+0

あなたはこの質問を見ましたか?/question/4091441/how-do-i-index-and-search-text-files-in-lucene-3-0-2?rq = 1 –

答えて

0

あなたの質問から、実際にはコンパイル時のエラーに直面し、実行時エラーではないと解釈するのは非常に難しいです。

コンパイル時エラーがField.Index.ANALYZEDFieldコンストラクタにあることを理解するためにコードをコピーする必要がありました。

Refer Documentationこれ以上のコンストラクタは6.5.0には存在しません。

これは、SOLRなどのトップレベルのツールを使用する理由の1つです。このような変更は、低いLucene APIで起こり続けるためです。

とにかく、上記のドキュメントに、そのもあなたが行うことに言及し、あなたのケースのために

Expert: directly create a field for a document. Most users should use one of the sugar subclasses:

TextFieldStringFieldは、関連するクラスである - 微妙な違い2があります。

だから、私はnew StringField(fieldName, fieldValue, Store.YES)のようなコンストラクタを直接使用する代わりに、Fieldを使っています。 fieldTypeFieldTypeあるnew Field(fieldName, fieldValue, fieldType) -

また同じようFieldを使用することができます。あなたが好きFieldType初期化することができます

- すべてのすべてでFieldType txtFieldType = new FieldType(TextField.TYPE_STORED) OR FieldType strFieldType = new FieldType(StringField.TYPE_STORED)など

を、彼らの方法あなたはLuceneのでFieldを作成するには、そのように使用されているLuceneのバージョンのドキュメントごとに、あなたのFieldインスタンスを作成最近のバージョンで変更されました。などdoc.add(new Field("username", username, new FieldType(TextField.TYPE_STORED)))

関連する問題