2017-06-29 17 views
0

私たちは多くの個人を特定できる情報を検索できる必要があります。私たちはElasticSearchをこれに使用することを考えていましたが、元の文書を保存するという問題があります。機密データの索引付け

フィールドにインデックスを作成する方法はありますか?フィールドを保存する方法はありますか?この場合、レコードをヒットした場合、元の文書を含むdynamoDBのレコードのGUID(暗号化されたGUID)が返されます。しかし、誰かがESデータベースを挟むと、元の情報を簡単に再構築できませんでした。

ありがとう、

アダム。私が欲しかっただけで何 - あなたが唯一のインデックスを持つ、元のソース文書を格納無効にすることができhttps://www.elastic.co/guide/en/elasticsearch/reference/current/mapping-source-field.html

+0

あなたはこれらの機密フィールドをハッシュすると考えましたか?これは一方向の操作なので、再構築することはできません。しかし、ハッシュキーを持っていれば、必要なフィールドを検索することができます。 –

+0

@ Tofig。応答していただきありがとうございます。文書内に編集可能な部分があるわけではありません。私たちはいくつかのフィルタ(ステミングフィルタなど)を通過させたいテキストブロックを用意していますので、フルテキスト検索を実行できますが、索引付け後にドキュメント自体を保存しないようにしてください。私はOKを説明しましたか? –

+0

ああ、そうです。私はハッシュが当時うまくいかないと思う。しかし、5.3のElasticSearchではdm-cryptを使ったディスクレベルの暗号化をサポートしています。それは助けることができるものですか? –

答えて

1

ただ答えを見つけました。 AmazonのDyanmoDBに元のドキュメントを保管します - 暗号化されています。 ESインデックスを使用すると、オリジナルのドキュメントを保存せずに必要な検索を実行できます。

ESのドキュメントは、このアプローチについて注意深く考えています。たとえば、インデックスを再作成する必要がある場合は、すべてをDynamoから取り出して、再びESを介してフィードする必要があります。

最近、AWSサミットに参加しました。私たちは、AWSサミットに参加し、ドキュメントのインデックスを作成してDynamoDBに保存するパイプラインとしてKinesisを検討するよう奨励しました。

アダム