2016-09-13 5 views
0

MarkLogicはEPUBを「処理」しません。 CPFはそうではありません。 MLCPはそうしない。EPUBでMLCPをロード

EPUBは、主にxhtml、xml、および画像を含むジップです。私はそれを.zipに改名し、MLCPでロードすることができます。しかし、URIの作成などに代わるものを追加しない限り、名前の変更はURIに表示されます。

また、.opfファイルには有用な情報が含まれていますが、バイナリとして読み込まれています。 .OPFをMIMEタイプに追加することはできますが、これはアーカイブからMLCPをロードすることと組み合わせて機能しません。それでも、それは再びBinaryとして表示されます。

私は余分なレイヤーを追加してMLにロードする前にデータを準備していません。そして、私ができる限り多くの情報を読み取り可能/索引付け可能にしたいと考えています。

より良い方法がありますか。 EPUBファイルをMarkLogicに読み込むための名前の変更、アンパック、MIMEタイプの入力?

答えて

3

私は個人的にMLCP変換を使用すると思います。あなたはそれが圧縮されたデータであることを知っていますので、xdmp:zip-manifestをトランスフォーム内に安全に適用することができます。複数のマップ:トランスフォーム内のマップオブジェクトを、epub zipの各パーツのuri/valueとともに出力できます。オプションを使用して、xdmp:zip-getに特定の形式の特定のファイルを読み取るよう指示できます。

HTH!

+0

素晴らしい作品が、私はそれがEPUBファイルからバイナリ(JPG)を保持できるかわからないので、私はマップを使用しないでください:ドキュメントでこのトピックを参照してください。 。 – Thijs

+1

はい、マップでバイナリを渡すことができます:map .. – grtjn

1

データベースに.opfファイルを1つのドキュメントとしてロードしたいのですか?mlcpで解凍し、含まれているXHTML、XML、およびイメージファイルを個別のドキュメントとしてデータベースに挿入しますか?

-input_compression_codecオプションを使用すると、後者の場合(ソースファイルの名前を変更せずに)これを実現できます。 、私はこれで遊んだ

http://docs.marklogic.com/guide/mlcp/import#id_13251

+0

興味深い!ありがとう。私はおそらく、言及した '変換'アプローチで行くでしょう、このように私はEPUBファイルをそのままロードし、すべての作業はサーバー側で行われます。 – Thijs