tdbloaderを使用して、YAGO 3 rdfトリプル(http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/のyago3_entire_ttl.7z)をapache-jena triplestore(3.1.0)に使用します。apache-jenaにロードする前にYAGOファイルをサニタイズするTDB triplestore
- 不正Unicodeエスケープシーケンス値:\\(0x5Cを)IRIにおける
- 不正文字
入力を検証するようにApache-イェーナによって提供暴動ツールがエラーの2種類(複数出現箇所)を与えます(コードポイント0x7C、 '|')
「\\」と「|」の代わりに、暴動の検証に合格した文字列が受け入れられましたが、他に解決策があるかどうかを知りたかったのですか?ここでの解決策が見つかりました
本当に、任意のアイデアを、同じ問題を意味しますか? – n1try
解決策ではありませんが、私の回避策:OpenlinkのVirtuosoのオープンソース版をtriplestoreとしてjenaライブラリと共に使用することになりました。 CentOS Linux 7で問題なく670Mioトリプレットをインポートしました。 –