2011-02-02 16 views
2

私はpdf文書を持っています。そのpdfからランダムな単語を取り出して保存したいと思います(インデックス/タグ付け)。次に、私はそのpdfドキュメントの検索可能なタグとしてこれらの単語を使用します。私は直接pdf文書を使用して単語を検索することはできませんので、その文書用に作成されたタグをリレーする必要があります。 pdfからそれらの単語を私に取り込むライブラリはありますか?これは私のMacアプリケーションに必要です。ココアでPDF文書のインデックスを作成する方法

ありがとうございました。

答えて

0

Spotlight Queryを試すか、PDFKitsearch manuallyでPDFを開くことができます。

注:「私はそのPDFから単語を取り出したい」と「単語を検索するためにpdfドキュメントを直接使用することはできません」という言葉が完全にはっきりしていません。 2つは相互排他的であるように見える。

更新

あなたは、b)のいずれかのかどうかをチェックし、あなたは文字通りあなたがa)の文書からランダムに選択した単語をタグとして使用したい意味ですか...「ランダム言葉を」言い続けます既存のリストからの単語が文書内にあるか、またはc)「重要で興味深い単語」を探すか?

「c」を意味する場合は、SearchKit to build the index in memoryを使用してください。

+0

私はpdfからいくつかのランダムな単語を取得し、その文書のタグとして使用する必要があります。私はこれらの言葉をpdfのタグとしてサーバーに送ります。次にクライアントが文書を検索したいときに、単語を入力すると、その単語をサーバーに送信しなければなりません。この単語をすべてのpdf文書のタグで検索します。これが要件です。しかし、私はどのようにpdf文書からランダムな言葉を得るのか混乱しています。これを行う準備ができているか、これを行うための独自のアルゴリズムを作成しています。 –

関連する問題