私はWARCファイルにデータが存在するとは言わない通常の使用例を扱っています。 [https://en.wikipedia.org/wiki/Web_ARChive][1] そして、私はNeo4jにデータをインポートしたいと思います。WARCファイル(WebArchive)からデータをインポートする
1つの解決策は、WARCファイル(一部のJavaコードを読み込む)を解析し、構造化データをCSVに書き込んで、いくつかのインポートツールを使用してロードできるようにすることです。
データをNeo4jにロードする唯一のオプションはCSVに抽出されていますか?
このユースケースの実装方法についてアドバイスをいただけますか?
おかげで、
Phaneendra
私が探しているのは、第2の選択肢 - 「抽出と解釈」ですね。データの抽出はneo4jの範囲外です。 私はこの質問にもjavaタグを使用していますので、私はここでこの分野に関するいくつかのガイダンスを要求したいと思います。 私は、「構造化されていないコンテンツから構造を作成する方法」が何であるかを考えています。フィールド1、フィールド2 ...を特定のドキュメントから抽出したいという設定が必要です。抽出する方法はいくつか定義されています。ある人が有用なリソースを指す場合は、ベストプラクティス。それは素晴らしいだろう。 – brownfox