私は、ユーザーが入力したキーワード/フレーズに基づいてコンテンツ検索を実行し、それらのキーワード/フレーズを含むエントリを返したいと考えています。 検索を実行するドキュメントは、バイナリデータとしてpostgressqlに格納されます。データベースでバイナリデータとして保存されたファイルに対してどのように索引付けを行うことができますか?
答えて
最初の手順は、バイナリファイルから読みやすいテキストを取得することです。さまざまなファイルタイプのテキストを読むための良いライブラリはApache TIKAです。 https://www.postgresql.org/docs/9.6/static/textsearch.html
代替:
あなたの文書のうち、読み取り可能なテキストを持ったら、元のバイナリ文書にはいくつかの参照と一緒にPostgreSQLでこのテキストを格納し、検索のためにPostgreSQLの全文検索機能を使用する必要があるだろうデータベースの検索機能にはApache Luceneのようになります。これまでのところ、Apache Luceneを使ってかなりクールな結果が得られました。
私はlucene.itを試してみましたが、number.canの中にあるこれらのファイルをデータベースに保存し、後でそれらを検索に使用するインデックスファイルを生成しますか?これは可能ですか? @sky – ExTincT
申し訳ありませんが、間違ったライブラリを参照しました。さまざまなファイルタイプからテキストを読み込むために私が推奨しているのは、Apache TIKAです。これは仕事にとって素晴らしいです(私の答えを編集しました)。いいえ、私はそれがデータベースにLuceneインデックスを格納することは意味がないと思う - 私はLuceneがとにかくそれにアクセスできないと思います。インデックスはファイルシステム上に保持する必要があります。なぜあなたはそれをデータベースに入れたいのですか? – Sky
私はバイナリデータとしてデータベースにアップロードされた文書を保存しているので、そのようにしたいと思っていました。検索している間は、バイナリデータを直接検索することができれば簡単でした(可能ならば)@sky – ExTincT
- 1. どのようにしてtxtファイルのリストを索引付けし、索引付けされた値を呼び出すのですか?
- 2. データベースにハッシュされたユーザー名を保存しようとしています
- 3. どのようにしてdatagridviewからデータベースに保存できますか?
- 4. バッチプログラムはこれをCSVに対して行うことができますか?
- 5. どのようにして常に最大化されたウィンドウを行うことができますか?
- 6. 最近変更された行はどのようにして見つけることができますか?
- 7. VBAを使用して保護されたワークシートに貼り付けることはできませんが、手動で行うことができます
- 8. データベースに保存しようとしたときのActiveRecordロールバック
- 9. RubyのRMagickリサイズ画像がデータベースにバイナリデータとして保存され
- 10. ユーザーがプロファイルを保存できるようにするimg。しかし、私は 'ユーザーを呼び出すことができない取得し続けている?'引数なし。ユーザーがストレージにプロフィールIMGを保存できるようにしようと
- 11. PostgreSQLは参照行をどのように索引付けしますか?
- 12. データはどのようにしてMySqlデータベースに保存されますか?
- 13. ファイルを.macファイルに保存しようとしています
- 14. CODA:どうすればftpでファイルとして保存できますか?
- 15. CSVからデータを索引付けしようとしています
- 16. ビジュアルスタジオがバイナリデータとしてPDFファイル内を検索しようとしないようにする
- 17. Ember Dataは、保存されたモデルデータのインスタンスに対してどのように書き込むのですか?
- 18. Perlで更新されたファイルをどのようにして読むことができますか?
- 19. parse-serverで文書フィールドをどのように索引付けしますか?
- 20. どのようにループでこれを行うことができますか?配列データに対して手動で行う必要はありません[
- 21. pdfファイルのディレクトリを索引付けして検索するためにApache TikaとApache Solrを構成するにはどうすればよいですか?
- 22. アプリケーションによってダウンロードされたファイルをどこに保存しますか?
- 23. Facebookに保存してPHPデータベースに保存するようにしました
- 24. #!/ usr/bin/php行にはどのような有用な引数を付けることができますか?
- 25. このタイプのネストされたオブジェクトは、どのようにしてレディスに保存できますか?
- 26. 検索 " - " これまでに検索しようとしたときwebsolrに
- 27. このDEBUGコードをどのようにしてウィンドウオブジェクトに対応させることができますか?
- 28. どのようにしてユーザー入力をアプリケーションに保存することができますか
- 29. ここにどのファイルが必要かをどのようにして知ることができますか?
- 30. どのようにしてR行ごとに共分散を見つけることができますか
インデックス作成にはどのツール/ APIを使用していますか? –
私はlucene 3.6.1を使用しています。これは、フォルダ内にインデックスファイルを生成します。 私は試してみて、後でそれを検索中に使いたい。これは可能ですか?これらの索引ファイルをデータベースに入れて保管し、検索中にその列を参照してください。 @ SabirKhan – ExTincT
インデックスを作成する目的は、後でそれらを検索することです。 Luceneも同じですし、Lucene 6.0.0以上を使用することをお勧めします。ルーセンはrdbmsではなくディスクに保存します。索引をrdbmsに格納することはできません。 –