2016-09-23 13 views
3

tdbloaderを使用して、YAGO 3 rdfトリプル(http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/のyago3_entire_ttl.7z)をapache-jena triplestore(3.1.0)に使用します。apache-jenaにロードする前にYAGOファイルをサニタイズするTDB triplestore

  1. 不正Unicodeエスケープシーケンス値:\\(0x5Cを)IRIにおける
  2. 不正文字

    入力を検証するようにApache-イェーナによって提供暴動ツールがエラーの2種類(複数出現箇所)を与えます(コードポイント0x7C、 '|')

「\\」と「|」の代わりに、暴動の検証に合格した文字列が受け入れられましたが、他に解決策があるかどうかを知りたかったのですか?ここでの解決策が見つかりました

+0

本当に、任意のアイデアを、同じ問題を意味しますか? – n1try

+1

解決策ではありませんが、私の回避策:OpenlinkのVirtuosoのオープンソース版をtriplestoreとしてjenaライブラリと共に使用することになりました。 CentOS Linux 7で問題なく670Mioトリプレットをインポートしました。 –

答えて

0

は今.TTLファイルは非Unicode文字がイエナがデータを受け入れるようにするために交換される前処理済みのいくつかの種類を、取得する必要があります。 Linuxではsed -iの/ |/-/g 'を実行する./* & & sed -i'/\\/-/g './* & & sed -i' s/-/-/g 'あなたの.ttlファイルがあるディレクトリ内から./*。 Windowsでは、Ubuntu Bashを起動し、それぞれのディレクトリ(/ mnt/c/Users/Ferdinand/yagoなど)に移動し、同じコマンドを実行します。数分かかります。私は、ここにいくつかの...

https://ferdinand-muetsch.de/how-to-load-yago-into-apache-jena-fuseki.html

+0

これはスペースのあるURIの問題を解決するために使用できますか? – RDangol

関連する問題